書生·浦語新一代大語言模型發佈向全社會開源，能對30萬字提煉資訊，能編《流浪地球3》劇本

2024-01-18 11:13:36 上海 65℃ 0

摘要：

記者俞陶然

昨天，上海人工智慧實驗室與商湯科技聯合香港中文大學、復旦大學發佈新一代大語言模型書生·浦語2.0（InternLM2）。這個大模型包含70億和200億兩種參數規格，以及基座、對話等版本，向全社會開源並提供免費商用授權。

與第一代大模型相比，第二代書生·浦語在數理、程式碼、對話、創作等各方面都有長足進步，綜合效能達到同量級開源模型的領先水準。

上海人工智慧實驗室聯合團隊認為，大模型各項性能提升的基礎在於語言建模能力的增强，對大模型的研究應回歸語言建模本質，通過更高質量的語料和更高的資訊密度，築牢大模型能力基礎。為此，聯合團隊開發了第三代數據清洗過濾科技，發展了多維度數據價值評估、高品質語料驅動的數據富集、針對性的數據補齊等科技方法，大幅提升了模型訓練效率。

InternLM2能够一次性處理約30萬漢字的輸入內容，從中準確選取關鍵資訊，實現對長文字的“大海撈針”。為測試InternLM2在長文字處理任務中的能力，研究人員將一份時長3小時的會議錄音轉錄稿輸入模型，要求它從中選取出關鍵資訊。測試結果顯示，雖然在未校對的文字中有較多錯別字，但InternLM2仍從中準確提煉出關鍵資訊，並總結了發言人的主要觀點。

在55個主流評測集上，InternLM2與多個同量級模型接受了綜合評測，結果顯示：InternLM2的羽量級（70億參數）和中量級（200億參數）版本效能處於領先水準；200億參數版本儘管只是中等規模，但在整體表現上達到了與ChatGPT比肩的水准。

書生·浦語2.0不僅在客觀性能指標上提升顯著，在主觀體驗上也有明顯改善，可以為用戶提供更好的對話和互動體驗。研究測試表明，InternLM2-Chat能精准地理解和遵循用戶意圖，具備較强的“共情”能力和豐富的結構化創作能力。它還具有想像力，根據用戶輸入的電影《流浪地球1》和《流浪地球2》劇情梗概，編寫《流浪地球3》的劇本。

“我們實驗室在黃浦江畔，希望成為我國人工智慧產業的源頭，為產業生態提供基座和支撐。”上海人工智慧實驗室領軍科學家林達華教授告訴記者。在他看來，國內企業可以利用開源的書生·浦語2.0，更低成本、更高效開發各種大模型應用產品。

為推動大模型應用落地，書生·浦源大模型挑戰賽同日啟動。首期賽事包含行業應用和創新創意兩個賽道，面向全球進行場景和賽隊徵集。

标签：

上一篇：“電科機器人1號”將投入應用驗證

下一篇：如何確保重點群體就業穩定

評論留言

熱心網友
暫時沒有留言

我要留言

昵稱：*

郵箱：

內容：

◎歡迎參與討論，請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示，請勿發佈垃圾資訊】