啟數光輪將AIGC與模擬技術深度融合生成映射現實世界的合成數據為人工智慧發展生產“原材料”

上海 23℃ 0
摘要:

  記者王閑樂

  隨著自動駕駛、ChatGPT等名詞在互聯網傳播,越來越多人知道了人工智慧科技。那麼,你知道發展人工智慧科技也需要“原材料”嗎?

  啟數光輪科技(上海)有限公司就是這樣一家生產人工智慧所需要的“原材料”——數據的公司。

  “現在人工智慧大模型迅速發展,對數據的需求特別大,整個互聯網的數據加一起都不够用了。”啟數光輪創始人謝晨說,這時候就需要通過合成數據來推動人工智慧發展。他之所以從蔚來汽車辭職創業,正是看到了這一領域的廣闊前景。

  為人工智慧提供海量數據

  謝晨曾在英偉達、Cruise、蔚來等企業擔任自動駕駛模擬負責人。在英偉達工作期間,謝晨發現,要讓自動駕駛變得更安全,需要大量的訓練數據。如果完全依賴於現實世界中的數據,不僅難以採集,而且存在利用率低、標注成本高和長尾場景缺乏等問題。於是,他萌生了一個大膽的想法——能不能人工合成出這些訓練數據?

  “比較通俗的類比是,人工智慧就像我們養殖的動物,需要吃飼料才能長大。可是單靠自然界中的飼料是不够的,所以我們得想辦法去自己生產一些飼料。”謝晨說,他想到的辦法是將生成式人工智慧(AIGC)與模擬技術深度融合。

  模擬技術本身並不罕見,但單靠模擬技術生成的數據真實度、泛化性與效率較低,通俗來講就是“不够真實”,囙此無法解决現有難點,還需探索如何與生成式人工智慧相結合。謝晨結合自己負責的自動駕駛業務,開始驗證兩種科技融合的可能性。

  經過反復驗證,謝晨用了5年時間,終於摸索出了生成式人工智慧與模擬技術最佳融合方法,由此可以生成映射現實世界的合成數據——影像或視頻,通過訓練算灋理解和學習現有數據便可生成3D、物理真實、可泛化的新數據。

  幫助中國企業追趕特斯拉

  2023年,帶著自己的研究成果,謝晨毅然决定從蔚來汽車辭職創業。

  “我們希望,通過合成數據的應用,助力中國汽車企業在自動駕駛科技上縮小與特斯拉的差距,甚至實現超越。”謝晨解釋道,特斯拉現在在全球擁有上百萬輛汽車,它們源源不斷地傳回數據、幫助人工智慧不斷優化。而中國車企掌握的數據可能只有特斯拉的百分之一,長此以往,雙方的人工智慧差距也會拉大。

  “啟數光輪可以提供海量合成數據,相當於加了一個杠杆,來填補中國車企在真實數據量上與特斯拉的差异。”謝晨說,啟數光輪成立後完成的第一單業務,就很好地證明了合成數據的價值。

  在業務拓展過程中,有汽車廠商告訴謝晨,企業正在研製的自動駕駛有個問題始終難以解决,就是會將路邊看板的人物圖案識別為真人進而啟動刹車。如果修改識別規則,又無法鑒別真正的行人,容易造成交通事故。

  “其實這裡的問題就在於企業缺乏足够多的路况數據。”謝晨的團隊拿下這一單,生成了數千個包含人像廣告的各類場景,並從中挑選出帶有精確標注的數據。這些數據隨後被該車企用於算灋訓練,果然有效增强了自動駕駛模型的表現。

  由此,啟數光輪在業界嶄露頭角,作為一家初創企業在業內迅速打響了名氣。成立一年多,就獲得了四輪融資,得到了多家頭部創投機构的認可。

  推動人工智慧相關產業發展

  從在大企業做創新研發,到自主創業,謝晨坦言,這一年多的經歷給了他很大挑戰,也讓他感到十分興奮。

  從一開始,他就給自己的新公司定了一個長遠的目標:成為數據界的英偉達。對此,謝晨很有信心。“我們有一個很棒的團隊,平均年齡28歲,來自合成數據、生成式人工智慧、模擬等領域的優秀科技人員占比超過90%,還有商業領域的人才。”

  現時,啟數光輪在謝晨的主導下搭建了國際領先的合成數據產線,擁有多項國內外科技專利,為多家海內外知名自動駕駛公司、國內外主機廠提供產品交付並形成合作夥伴關係,累計服務客戶幾十餘家,交付數據上億幀,積累場景數百萬個。

  “使用合成數據訓練人工智慧已經是矽谷的共識,但國內對這塊認識還不够。”謝晨希望,通過啟數光輪的一系列成功案例,讓更多人意識到合成數據的價值,推動自動駕駛、具身智慧等相關產業蓬勃發展。

标签:

評論留言

  • 熱心網友
    暫時沒有留言

我要留言

◎歡迎參與討論,請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示,請勿發佈垃圾資訊】