推出行業首個“雲、端、邊”產品矩陣5.0版大模型綜合能力顯著提升商湯撞出“百模爭流”大聲響

2024-04-28 11:13:28 上海 46℃ 0

摘要：

記者李曄

“2018年提出SenseCore大裝置時，我將其類比為人工智慧的粒子對撞機，以期撞出AI基礎科學定律。”4月23日說這話時，商湯科技董事長兼CEO徐立身處大裝置所在的商湯臨港智算中心。1小時後，他向台下濟濟一堂的生態夥伴與客戶介紹行業首個“雲、端、邊”全棧大模型產品矩陣及日日新大模型SenseNova5.0版，後者綜合能力據稱已達到或超越GPT-4 turbo。

翌日，商湯科技開盤價上漲逾30%，當周股價漲幅近100%。

六年前，被徐立稱為“機器的猜想”的大裝置，讓人看不懂；六年來，商湯每年數十億元往裏砸錢，外界不看好。直到近期，商湯披露2023年財報，加上4月23日商湯技術交流日上一系列成果發佈，人們恍然大悟：“機器的猜想”不僅撞出了“三月一更”的日日新大模型，撞出了“百模爭流”的算力柴火，還把商湯從行業標杆推向生態引領與建設者“大哥”角色。

“不響”的商湯，在AI大模型演進潮中，激起業內大聲響。

落地

去年4月，商湯的日日新SenseNova大模型體系首次亮相，短短一年內，已反覆運算至5.0版，能力再進階。

論寫作，一篇有關《紅樓夢》的高考作文，GPT-4遵循老套路，日日新5.0版卻能從《詩經》談起，引用革故鼎新的典故，再融合互聯網熱詞，行文發散，思路打開。

論“文生圖”，“一張具SenseNova標誌的未來派建築圖”，無論標誌所嵌位置的恰當性，還是建築底部呈現的倒影波浪，均實現了較完整的“指令跟隨”。

被問及“13比特小朋友玩老鷹抓小雞，已抓5只，還剩幾只？”時，日日新5.0版回答“還剩7只”，證明它準確理解了遊戲規則。

徐立介紹，5.0版效能突破，一靠模型架構，二靠數據構造。在混合專家架構（MoE）下，大模型數千億參數僅“稀疏”啟動便能實現高效推理。此次商湯著重在推理層構造了數千億個旨在理順邏輯的合成數據。如金融領域，諸多檔案間存在規則衝突，商湯構建了外規强於內規、新規覆蓋舊規的强思維鏈，這成為大模型能力提升的關鍵。

“百模大戰”仍酣，落地才是王道。徐立堅信，中心化的算力需求必會向端側及行業邊緣側拓展，為此商湯早有佈局，此番亮出“雲、端、邊”全棧大模型產品線，從辦公和程式碼助手到虛擬形象再到手機汽車智慧終端，均在商湯“射程”內。小米、華為、金山辦公、海通證券、閱文集團等一眾燈塔客戶更是親自前來站臺。

小米集團小愛總經理王剛透露，近期推出的小米汽車SU7，由小愛同學為車主提供智慧互動體驗，其中也應用了商湯的大模型科技。上“打”GPT-4，下接百千行，商湯此次亮相頗為驚豔，徐立卻多次強調“性價比”。如針對金融、醫療、政務等領域，商湯推出企業級大模型一體機，不僅解决敏感行業“數據不出域”，而且價格親民。“像程式碼大模型一體機，我們按照算力模型仔細核算成本，實現本地部署，單臺支持100人研發團隊使用，人均每天僅4.5元。”徐立笑言，這大概要拜過去“踩坑無數”所賜。

柴火

大模型訓練如煉丹，以GPU為覈心的算力如柴火。為訓練GPT-3.5，OpenAI使用了1萬張英偉達GPU。可見誰柴火儲備多，誰就佔據主動。

商湯六年前即佈局SenseCore大裝置，2019年就已具備千卡並聯能力，現總算力規模增至12000P，運營GPU高達4.5萬張。去年，商湯基於“大模型+大裝置”的生成式AI業務錄得12億元收入，占總收入的35%。這也是商湯成立以來從無到有最快超十億元收入體量的新業務。

2022年底，ChatGPT橫空出世，引發全球範圍AI算力需求激增。商湯何以提前四年便有前瞻認知，投入累計達數百億元？徐立自謙，“當時旨在降成本”。AI落地之初，監控窨井蓋缺失等場景，需單獨部署算灋、數據和一群人。換一個場景，又是相同配寘。徐立便考慮，乾脆以一個通用模型來覆蓋多場景。但模型越通用，訓練數據和模型參數就越多，對算力要求也越高。當年，商湯在市場上遍尋不著可以大規模互聯的AI算力集羣，甚至被雲廠商嫌弃這需求過於小眾，要求商湯自行承擔全部一次性工程費用。

那還不如自建呢！當時徐立對下一階段算力需求爆發的判斷在AI驅動的科研上，提出地球科學、資料、生物、製藥、能源五大方向。這些行業尚未形成定律，AI在其中定大有空間。2018年起，商湯投建大裝置，2020年夏在臨港建設智算中心，從此開弓再無回頭箭。

很快，曾經的“小眾”需求，便演變為行業主流。商湯自用算力逐漸向外輸出，大裝置現已實現對萬億參數大模型的生產支持，具有超30天穩定訓練不間斷能力，出現間斷時的診斷恢復時長也被優化至半小時內。

國內正“煉丹”的大模型深知，這些硬核數位對它們意味著什麼。

生態

但算力輸出能力不單以擁有多少張卡為標準。

從千卡並聯躍上萬卡臺階，對集羣穩定性和高效計算構成巨大挑戰，而且這種工程化的能力無工作可抄，唯有無數個日夜的沉浸式攻關。當下，直面國產算力替代問題，商湯所需攻克的難點更多，“將不同晶片組織起來的算力集羣要解决連接、異構、能耗、穩定性極限等”。徐立稱，商湯總算力中，國產算力已達2000P，未來占比還會更多。

商湯還與上海人工智慧實驗室一同研發了DeepLink平行計算體系。該體系可確保國產芯適配主流的大模型訓練框架和算灋庫，現已能覆蓋99.5%的CUDA所支持的大模型計算需求。

現時，包括華為、寒武紀、壁仞、沐曦等在內，商湯大裝置已可深度適配20餘款國產晶片，已落地多個千卡級別的國產算力集羣。

關於擔任國產算力生態構建者這一全新角色，徐立認為，用合適的應用來倒推國產算力架構能力提升，或是可行之路。“我們現在面臨挑戰，但正囙此，算力平臺的相容性、異構調度的相容性等在承壓之下定會奮力崛起。”他自信地說。

标签：

上一篇：國產抗腫瘤藥獲美國FDA準予上市已惠及逾18萬患者

下一篇：C919大飛機獲國航百架大單今年起至2031年分批交付進度與東航同步

評論留言

熱心網友
暫時沒有留言

我要留言

昵稱：*

郵箱：

內容：

◎歡迎參與討論，請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示，請勿發佈垃圾資訊】