GPT大熱背後,滬上信息化企業家有冷思考大語言模型競逐,算力才是關鍵

上海 37℃ 0
摘要:GPT大熱背後,滬上信息化企業家不免形成冷思考。據悉,支撐GPT大語言模型的GPU晶片,前有英偉達A100,單價9萬元一枚;英偉達最新一代H100效能更優,但單枚價格高達25萬元。

  記者李曄

  這本是一場信息化企業家協會的換屆選舉,部分正在全國乃至全球各地洽談業務的企業家們本難以到場,卻不惜中途趕回上海。除了要投出心目中的會長人選之外,更是沖著大會專題論壇聚焦的“GPT大語言模型的應用和機遇”主題。

  22年前作為大學生創業的聯合麥通CEO陳哲敏搶到了第一個提問GPT業內大咖的機會。他的公司為世界500强企業提供客戶管理服務,有著規模達3000人的外包呼叫中心。陳哲敏的著急在於,大語言模型對通用常識和專業問題的解答存在巨大差异,距離真正的專業垂直場景應用還要走多遠?

  這並非陳哲敏一家的困惑。達觀數據創始人陳運文也早已關注到,如果問ChatGPT一些專業問題,它的回答往往東拉西扯,說不到重點或不够深刻。但這種“一本正經胡說八道”,並不能掩蓋GPT巨大的科技突破和出色表現。

  在國內,近期,多個國產大語言模型競相官宣,包括阿裡“通義千問”、商湯“日日新”、復旦“MOSS”、百度“文心一言”、清華大學“ChatGLM—6B”等。達觀數據也推出了國產GPT系統“曹植”系統,面向金融、政務、製造領域推出類似微軟Copilot的“達觀助手”,幫助用戶更好地進行文字自動化撰寫、稽核、排版等。

  在陳運文看來,國產大語言模型“大亂鬥”反倒是好事。“大家走的技術路線相似,但用到的數據參數和規模訓練管道有所差异,各家可結合業務優勢,專注於構建垂直、專用領域的大語言模型。”

  GPT大熱背後,滬上信息化企業家不免形成冷思考。微軟(中國)一比特資深專家介紹,ChatGPT看似只是聊天機器人,實為模型與算力的“肌肉展示”。現時,微軟的Azure雲服務已為ChatGPT構建了超過1萬枚英偉達A100GPU晶片的AI計算集羣,並以此為底氣,簽下200餘家頭部客戶。“云計算科技界公認的一個說法是,1萬枚英偉達A100GPU晶片是做好大語言模型的算力門檻,訓練一個垂直的大語言模型也至少需要千枚GPU晶片。囙此,現在我們更應關注國內是否有機會跑出GPU來。”這位業界大咖說。

  據記者瞭解,在GPT大語言模型問世前,我國幾乎沒有任何應用場景需要用到如此大的算力。如今,數量需求巨大且價格高企的GPU晶片,也讓國內可佈局類GPT的選手企業有限。據悉,支撐GPT大語言模型的GPU晶片,前有英偉達A100,單價9萬元一枚;英偉達最新一代H100效能更優,但單枚價格高達25萬元。這意味著,能承受如此大投入的國內選手寥寥無幾。

  事實上,早在2016年,英偉達創始人黃仁勳就向OpenAI捐贈了超級電腦DGX-1。此舉大大提升了OpenAI的算力,才有了如今ChatGPT的高光時刻。與會企業家們建議,能否探索商湯、阿裡等國內大廠超大智算中心的算力租賃模式,從而解决中小企業佈局大語言模型的算力不足痛點。

  在此次會議上,上海市信息化企業家協會完成換屆,上海龍軟電子集團有限公司董事長戴劍飆連任第三届理事會會長。

标签: 晶片

評論留言

  • 熱心網友
    暫時沒有留言

我要留言

◎歡迎參與討論,請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示,請勿發佈垃圾資訊】