記者李曄
“2018年提出SenseCore大裝置時,我將其類比為人工智慧的粒子對撞機,以期撞出AI基礎科學定律。”4月23日說這話時,商湯科技董事長兼CEO徐立身處大裝置所在的商湯臨港智算中心。1小時後,他向台下濟濟一堂的生態夥伴與客戶介紹行業首個“雲、端、邊”全棧大模型產品矩陣及日日新大模型SenseNova5.0版,後者綜合能力據稱已達到或超越GPT-4 turbo。
翌日,商湯科技開盤價上漲逾30%,當周股價漲幅近100%。
六年前,被徐立稱為“機器的猜想”的大裝置,讓人看不懂;六年來,商湯每年數十億元往裏砸錢,外界不看好。直到近期,商湯披露2023年財報,加上4月23日商湯技術交流日上一系列成果發佈,人們恍然大悟:“機器的猜想”不僅撞出了“三月一更”的日日新大模型,撞出了“百模爭流”的算力柴火,還把商湯從行業標杆推向生態引領與建設者“大哥”角色。
“不響”的商湯,在AI大模型演進潮中,激起業內大聲響。
落地
去年4月,商湯的日日新SenseNova大模型體系首次亮相,短短一年內,已反覆運算至5.0版,能力再進階。
論寫作,一篇有關《紅樓夢》的高考作文,GPT-4遵循老套路,日日新5.0版卻能從《詩經》談起,引用革故鼎新的典故,再融合互聯網熱詞,行文發散,思路打開。
論“文生圖”,“一張具SenseNova標誌的未來派建築圖”,無論標誌所嵌位置的恰當性,還是建築底部呈現的倒影波浪,均實現了較完整的“指令跟隨”。
被問及“13比特小朋友玩老鷹抓小雞,已抓5只,還剩幾只?”時,日日新5.0版回答“還剩7只”,證明它準確理解了遊戲規則。
徐立介紹,5.0版效能突破,一靠模型架構,二靠數據構造。在混合專家架構(MoE)下,大模型數千億參數僅“稀疏”啟動便能實現高效推理。此次商湯著重在推理層構造了數千億個旨在理順邏輯的合成數據。如金融領域,諸多檔案間存在規則衝突,商湯構建了外規强於內規、新規覆蓋舊規的强思維鏈,這成為大模型能力提升的關鍵。
“百模大戰”仍酣,落地才是王道。徐立堅信,中心化的算力需求必會向端側及行業邊緣側拓展,為此商湯早有佈局,此番亮出“雲、端、邊”全棧大模型產品線,從辦公和程式碼助手到虛擬形象再到手機汽車智慧終端,均在商湯“射程”內。小米、華為、金山辦公、海通證券、閱文集團等一眾燈塔客戶更是親自前來站臺。
小米集團小愛總經理王剛透露,近期推出的小米汽車SU7,由小愛同學為車主提供智慧互動體驗,其中也應用了商湯的大模型科技。上“打”GPT-4,下接百千行,商湯此次亮相頗為驚豔,徐立卻多次強調“性價比”。如針對金融、醫療、政務等領域,商湯推出企業級大模型一體機,不僅解决敏感行業“數據不出域”,而且價格親民。“像程式碼大模型一體機,我們按照算力模型仔細核算成本,實現本地部署,單臺支持100人研發團隊使用,人均每天僅4.5元。”徐立笑言,這大概要拜過去“踩坑無數”所賜。
柴火
大模型訓練如煉丹,以GPU為覈心的算力如柴火。為訓練GPT-3.5,OpenAI使用了1萬張英偉達GPU。可見誰柴火儲備多,誰就佔據主動。
商湯六年前即佈局SenseCore大裝置,2019年就已具備千卡並聯能力,現總算力規模增至12000P,運營GPU高達4.5萬張。去年,商湯基於“大模型+大裝置”的生成式AI業務錄得12億元收入,占總收入的35%。這也是商湯成立以來從無到有最快超十億元收入體量的新業務。
2022年底,ChatGPT橫空出世,引發全球範圍AI算力需求激增。商湯何以提前四年便有前瞻認知,投入累計達數百億元?徐立自謙,“當時旨在降成本”。AI落地之初,監控窨井蓋缺失等場景,需單獨部署算灋、數據和一群人。換一個場景,又是相同配寘。徐立便考慮,乾脆以一個通用模型來覆蓋多場景。但模型越通用,訓練數據和模型參數就越多,對算力要求也越高。當年,商湯在市場上遍尋不著可以大規模互聯的AI算力集羣,甚至被雲廠商嫌弃這需求過於小眾,要求商湯自行承擔全部一次性工程費用。
那還不如自建呢!當時徐立對下一階段算力需求爆發的判斷在AI驅動的科研上,提出地球科學、資料、生物、製藥、能源五大方向。這些行業尚未形成定律,AI在其中定大有空間。2018年起,商湯投建大裝置,2020年夏在臨港建設智算中心,從此開弓再無回頭箭。
很快,曾經的“小眾”需求,便演變為行業主流。商湯自用算力逐漸向外輸出,大裝置現已實現對萬億參數大模型的生產支持,具有超30天穩定訓練不間斷能力,出現間斷時的診斷恢復時長也被優化至半小時內。
國內正“煉丹”的大模型深知,這些硬核數位對它們意味著什麼。
生態
但算力輸出能力不單以擁有多少張卡為標準。
從千卡並聯躍上萬卡臺階,對集羣穩定性和高效計算構成巨大挑戰,而且這種工程化的能力無工作可抄,唯有無數個日夜的沉浸式攻關。當下,直面國產算力替代問題,商湯所需攻克的難點更多,“將不同晶片組織起來的算力集羣要解决連接、異構、能耗、穩定性極限等”。徐立稱,商湯總算力中,國產算力已達2000P,未來占比還會更多。
商湯還與上海人工智慧實驗室一同研發了DeepLink平行計算體系。該體系可確保國產芯適配主流的大模型訓練框架和算灋庫,現已能覆蓋99.5%的CUDA所支持的大模型計算需求。
現時,包括華為、寒武紀、壁仞、沐曦等在內,商湯大裝置已可深度適配20餘款國產晶片,已落地多個千卡級別的國產算力集羣。
關於擔任國產算力生態構建者這一全新角色,徐立認為,用合適的應用來倒推國產算力架構能力提升,或是可行之路。“我們現在面臨挑戰,但正囙此,算力平臺的相容性、異構調度的相容性等在承壓之下定會奮力崛起。”他自信地說。
評論留言