復旦MOSS升級版開源上線

上海 37℃ 0
摘要:與之相比,MOSS開源數據大多為多輪對話數據,涵蓋模型有用性、忠實性、無害性,包含中英雙語;開源模型包含160億參數,具有更多的湧現能力和更强的知識性。MOSS還開源了挿件增强對話模型,這種能力現時是國內獨一無二的。

  記者俞陶然

  記者昨天獲悉,復旦大學自然語言處理實驗室開發的新版MOSS模型已上線,成為國內首個挿件增强的開源對話語言模型,支持搜尋引擎、影像生成、小算盘、方程求解器等挿件工具。

  現時,相關程式碼、數據、模型參數已在Github、Hugging Face等平臺開放。開源程式碼涵蓋模型訓練和推理程式碼,開源數據包括超100萬條對話訓練數據,開源模型包括160億參數中英雙語基座語言模型、對話模型及挿件增强的對話模型。

  復旦大學計算機科學技術學院教授、MOSS系統負責人邱錫鵬表示,近一個月來,開源社區對ChatGPT十分關注,湧現出很多優秀的開源數據和模型,但是已開源項目大多有以下局限:僅包含單輪指令數據、僅聚焦模型有用性、以英文為主、模型參數量較小(通常不足百億)。與之相比,MOSS開源數據大多為多輪對話數據,涵蓋模型有用性、忠實性、無害性,包含中英雙語;開源模型包含160億參數,具有更多的湧現能力和更强的知識性。MOSS還開源了挿件增强對話模型,這種能力現時是國內獨一無二的。

  未來,MOSS將陸續開源更多訓練數據及模型參數,促進人工智慧領域的科學研究和開源社區的生態繁榮,同時也為企業私有化部署人工智慧模型、開展相關服務提供解決方案。

評論留言

  • 熱心網友
    暫時沒有留言

我要留言

◎歡迎參與討論,請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示,請勿發佈垃圾資訊】