記者俞陶然
昨天,上海人工智慧實驗室與商湯科技聯合香港中文大學、復旦大學發佈新一代大語言模型書生·浦語2.0(InternLM2)。這個大模型包含70億和200億兩種參數規格,以及基座、對話等版本,向全社會開源並提供免費商用授權。
與第一代大模型相比,第二代書生·浦語在數理、程式碼、對話、創作等各方面都有長足進步,綜合效能達到同量級開源模型的領先水準。
上海人工智慧實驗室聯合團隊認為,大模型各項性能提升的基礎在於語言建模能力的增强,對大模型的研究應回歸語言建模本質,通過更高質量的語料和更高的資訊密度,築牢大模型能力基礎。為此,聯合團隊開發了第三代數據清洗過濾科技,發展了多維度數據價值評估、高品質語料驅動的數據富集、針對性的數據補齊等科技方法,大幅提升了模型訓練效率。
InternLM2能够一次性處理約30萬漢字的輸入內容,從中準確選取關鍵資訊,實現對長文字的“大海撈針”。為測試InternLM2在長文字處理任務中的能力,研究人員將一份時長3小時的會議錄音轉錄稿輸入模型,要求它從中選取出關鍵資訊。測試結果顯示,雖然在未校對的文字中有較多錯別字,但InternLM2仍從中準確提煉出關鍵資訊,並總結了發言人的主要觀點。
在55個主流評測集上,InternLM2與多個同量級模型接受了綜合評測,結果顯示:InternLM2的羽量級(70億參數)和中量級(200億參數)版本效能處於領先水準;200億參數版本儘管只是中等規模,但在整體表現上達到了與ChatGPT比肩的水准。
書生·浦語2.0不僅在客觀性能指標上提升顯著,在主觀體驗上也有明顯改善,可以為用戶提供更好的對話和互動體驗。研究測試表明,InternLM2-Chat能精准地理解和遵循用戶意圖,具備較强的“共情”能力和豐富的結構化創作能力。它還具有想像力,根據用戶輸入的電影《流浪地球1》和《流浪地球2》劇情梗概,編寫《流浪地球3》的劇本。
“我們實驗室在黃浦江畔,希望成為我國人工智慧產業的源頭,為產業生態提供基座和支撐。”上海人工智慧實驗室領軍科學家林達華教授告訴記者。在他看來,國內企業可以利用開源的書生·浦語2.0,更低成本、更高效開發各種大模型應用產品。
為推動大模型應用落地,書生·浦源大模型挑戰賽同日啟動。首期賽事包含行業應用和創新創意兩個賽道,面向全球進行場景和賽隊徵集。
評論留言