GPT大熱背後，滬上信息化企業家有冷思考大語言模型競逐，算力才是關鍵

2023-04-16 11:13:06 上海 73℃ 0

摘要：GPT大熱背後，滬上信息化企業家不免形成冷思考。據悉，支撐GPT大語言模型的GPU晶片，前有英偉達A100，單價9萬元一枚；英偉達最新一代H100效能更優，但單枚價格高達25萬元。

記者李曄

這本是一場信息化企業家協會的換屆選舉，部分正在全國乃至全球各地洽談業務的企業家們本難以到場，卻不惜中途趕回上海。除了要投出心目中的會長人選之外，更是沖著大會專題論壇聚焦的“GPT大語言模型的應用和機遇”主題。

22年前作為大學生創業的聯合麥通CEO陳哲敏搶到了第一個提問GPT業內大咖的機會。他的公司為世界500强企業提供客戶管理服務，有著規模達3000人的外包呼叫中心。陳哲敏的著急在於，大語言模型對通用常識和專業問題的解答存在巨大差异，距離真正的專業垂直場景應用還要走多遠？

這並非陳哲敏一家的困惑。達觀數據創始人陳運文也早已關注到，如果問ChatGPT一些專業問題，它的回答往往東拉西扯，說不到重點或不够深刻。但這種“一本正經胡說八道”，並不能掩蓋GPT巨大的科技突破和出色表現。

在國內，近期，多個國產大語言模型競相官宣，包括阿裡“通義千問”、商湯“日日新”、復旦“MOSS”、百度“文心一言”、清華大學“ChatGLM—6B”等。達觀數據也推出了國產GPT系統“曹植”系統，面向金融、政務、製造領域推出類似微軟Copilot的“達觀助手”，幫助用戶更好地進行文字自動化撰寫、稽核、排版等。

在陳運文看來，國產大語言模型“大亂鬥”反倒是好事。“大家走的技術路線相似，但用到的數據參數和規模訓練管道有所差异，各家可結合業務優勢，專注於構建垂直、專用領域的大語言模型。”

GPT大熱背後，滬上信息化企業家不免形成冷思考。微軟（中國）一比特資深專家介紹，ChatGPT看似只是聊天機器人，實為模型與算力的“肌肉展示”。現時，微軟的Azure雲服務已為ChatGPT構建了超過1萬枚英偉達A100GPU晶片的AI計算集羣，並以此為底氣，簽下200餘家頭部客戶。“云計算科技界公認的一個說法是，1萬枚英偉達A100GPU晶片是做好大語言模型的算力門檻，訓練一個垂直的大語言模型也至少需要千枚GPU晶片。囙此，現在我們更應關注國內是否有機會跑出GPU來。”這位業界大咖說。

據記者瞭解，在GPT大語言模型問世前，我國幾乎沒有任何應用場景需要用到如此大的算力。如今，數量需求巨大且價格高企的GPU晶片，也讓國內可佈局類GPT的選手企業有限。據悉，支撐GPT大語言模型的GPU晶片，前有英偉達A100，單價9萬元一枚；英偉達最新一代H100效能更優，但單枚價格高達25萬元。這意味著，能承受如此大投入的國內選手寥寥無幾。

事實上，早在2016年，英偉達創始人黃仁勳就向OpenAI捐贈了超級電腦DGX-1。此舉大大提升了OpenAI的算力，才有了如今ChatGPT的高光時刻。與會企業家們建議，能否探索商湯、阿裡等國內大廠超大智算中心的算力租賃模式，從而解决中小企業佈局大語言模型的算力不足痛點。

在此次會議上，上海市信息化企業家協會完成換屆，上海龍軟電子集團有限公司董事長戴劍飆連任第三届理事會會長。

标签：晶片

上一篇：上海一些社區衛生服務中心曾經具備不少初級外科功能外科服務能否重新回到居民家門口

下一篇：技術成果轉化契约金額創下破億元紀錄，但科技成果轉化率常年低於8%醫療科研“沉睡專利”亟待喚醒

評論留言

熱心網友
暫時沒有留言

我要留言

昵稱：*

郵箱：

內容：

◎歡迎參與討論，請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示，請勿發佈垃圾資訊】