國家級專精特新“小巨人”企業發佈算力生態平臺“流程編排”化算力為“算利”

上海 24℃ 0
摘要:

  記者俞陶然

  人工智慧大模型的興起,讓GPU(圖形處理器)算力成為極其重要的資源。在這個領域,GPU算力雲服務扮演著重要角色,可以實現算力資源跨地區、跨行業的自由流動。最近,國家級專精特新“小巨人”企業——上海道客,聯合行業夥伴發佈了“d.run算力一體化方案”。這個方案包括上海、合肥等地的算力中心服務,算灋開發、模型微調等模型開發工具以及智慧應用、流程編排等應用開發工具,為用戶提供一個AI算力生態平臺。

  AI基礎設施

  近5年來,我國算力產業規模快速增長,年均增速超過30%,但還存在覈心晶片和國產基礎軟件生態不强、傳輸能力不足、無效算力增多等挑戰。上海道客創始人、首席執行官陳齊彥認為,大模型興起後,除了GPU晶片供給不足,我國人工智慧產業還面臨協同服務、落地應用等方面的問題。如何提高國內已有算力的使用效率?這需要包括雲服務供應商在內的算力產業鏈上所有企業的共同努力,打造出全方位的算力一體化解決方案。

  2014年,來自易安信EMC中國研究院的陳齊彥團隊走上創業道路,他們專注於雲原生領域,使上海道客逐漸成長為這一領域的頭部企業。所謂雲原生,是一系列雲科技和開發管理方法的集合,它們試圖在動態環境中尋找最優解,可通過調度發揮算力的最大效能,實現算力資源的靈活按需分配。在雲原生開源社區,道客對覈心開源項目Kubernetes的貢獻度排名全球第三,僅次於穀歌和紅帽公司。

  如今,這家上海企業基於雲原生科技,與猴子無限等企業聯手開發了旨在讓算力更自由的“d.run算力一體化方案”。訪問d.run,記者看到4個板塊:算力集羣、模型應用、模型工具和管理。在算力集羣板塊,用戶可購買上海、合肥等地的GPU算力;在模型應用板塊,可使用語料庫、各種挿件和資料分析工具,對垂直類模型應用進行訓練和評測;在模型工具板塊,多種算灋開發、模型微調類工具供用戶選擇,包括訓練大模型所必需的數据集。

  “我們希望借助這個平臺打通從GPU供應到協同服務,再到落地應用的產業鏈,讓AI基礎設施像水和電一樣流向客戶,助力提升我國人工智慧產業的有效算力,化算力為‘算利’。”陳齊彥在發佈會上說。

  “智慧體工作流”

  作為上海道客的合作夥伴,北京猴子無限公司為d.run開發了流程編排模塊。這家企業獲得了奇績創壇創始人、百度原總裁陸奇的投資,專注於模型調优。公司創始人、首席執行官尹伯昊介紹,斯坦福大學教授、著名人工智慧專家吳恩達最近在社交平臺X上表示:“智慧體工作流”今年將推動人工智慧快速發展,其智慧水准可能超過下一代基礎大模型。

  什麼是“智慧體工作流”?現時,大語言模型根據提示詞輸出一篇文章,是直接生成的,這相當於人類寫文章時不做任何修改,所以文章質量往往並不是很高。“智慧體工作流”則與人類寫文章的過程很接近,將工作流程分為寫提綱、收集資訊、寫初稿、修改初稿等若干步驟。在執行每個步驟時,用戶都可以介入,讓“智慧體工作流”生成的內容更符合自己的要求。

  對於吳恩達的觀點,尹伯昊十分認同:“流程數據是通向智慧體的鑰匙,流程驅動可以讓大模型更優、更快地落地。”為此,他帶領團隊正在構建以流程為中心的大模型落地平臺,並與上海道客合作,將“流程編排”模塊嵌入d.run平臺。在雲原生的高可用環境中,很多企業可以為AI開放生態平臺賦能,構建一套體系化流程,助力用戶更快地開發出高品質的AI大模型應用。

  吳恩達團隊的實驗研究發現:在零樣本條件下,GPT-3.5生成內容的正確率為48.1%,GPT-4的正確率達到67.0%;如果採用“智慧體工作流”模式,GPT-3.5的正確率高達95.1%,遠超GPT-4。這個對比實驗給尹伯昊團隊帶來了很大信心,而在“實戰”環境中,以流程為中心的大模型落地平臺能否催生高品質的AI大模型應用?還有待用戶檢驗。

标签:

評論留言

  • 熱心網友
    暫時沒有留言

我要留言

◎歡迎參與討論,請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示,請勿發佈垃圾資訊】