復旦MOSS升級版開源上線

2023-04-22 11:13:00 上海 76℃ 0

摘要：與之相比，MOSS開源數據大多為多輪對話數據，涵蓋模型有用性、忠實性、無害性，包含中英雙語；開源模型包含160億參數，具有更多的湧現能力和更强的知識性。MOSS還開源了挿件增强對話模型，這種能力現時是國內獨一無二的。

記者俞陶然

記者昨天獲悉，復旦大學自然語言處理實驗室開發的新版MOSS模型已上線，成為國內首個挿件增强的開源對話語言模型，支持搜尋引擎、影像生成、小算盘、方程求解器等挿件工具。

現時，相關程式碼、數據、模型參數已在Github、Hugging Face等平臺開放。開源程式碼涵蓋模型訓練和推理程式碼，開源數據包括超100萬條對話訓練數據，開源模型包括160億參數中英雙語基座語言模型、對話模型及挿件增强的對話模型。

復旦大學計算機科學技術學院教授、MOSS系統負責人邱錫鵬表示，近一個月來，開源社區對ChatGPT十分關注，湧現出很多優秀的開源數據和模型，但是已開源項目大多有以下局限：僅包含單輪指令數據、僅聚焦模型有用性、以英文為主、模型參數量較小（通常不足百億）。與之相比，MOSS開源數據大多為多輪對話數據，涵蓋模型有用性、忠實性、無害性，包含中英雙語；開源模型包含160億參數，具有更多的湧現能力和更强的知識性。MOSS還開源了挿件增强對話模型，這種能力現時是國內獨一無二的。

未來，MOSS將陸續開源更多訓練數據及模型參數，促進人工智慧領域的科學研究和開源社區的生態繁榮，同時也為企業私有化部署人工智慧模型、開展相關服務提供解決方案。

标签：開放原始程式碼

上一篇：工業品線上交易節下周開幕

下一篇：《孫中山文獻集成》問世

評論留言

熱心網友
暫時沒有留言

我要留言

昵稱：*

郵箱：

內容：

◎歡迎參與討論，請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示，請勿發佈垃圾資訊】