記者王閑樂
隨著自動駕駛、ChatGPT等名詞在互聯網傳播,越來越多人知道了人工智慧科技。那麼,你知道發展人工智慧科技也需要“原材料”嗎?
啟數光輪科技(上海)有限公司就是這樣一家生產人工智慧所需要的“原材料”——數據的公司。
“現在人工智慧大模型迅速發展,對數據的需求特別大,整個互聯網的數據加一起都不够用了。”啟數光輪創始人謝晨說,這時候就需要通過合成數據來推動人工智慧發展。他之所以從蔚來汽車辭職創業,正是看到了這一領域的廣闊前景。
為人工智慧提供海量數據
謝晨曾在英偉達、Cruise、蔚來等企業擔任自動駕駛模擬負責人。在英偉達工作期間,謝晨發現,要讓自動駕駛變得更安全,需要大量的訓練數據。如果完全依賴於現實世界中的數據,不僅難以採集,而且存在利用率低、標注成本高和長尾場景缺乏等問題。於是,他萌生了一個大膽的想法——能不能人工合成出這些訓練數據?
“比較通俗的類比是,人工智慧就像我們養殖的動物,需要吃飼料才能長大。可是單靠自然界中的飼料是不够的,所以我們得想辦法去自己生產一些飼料。”謝晨說,他想到的辦法是將生成式人工智慧(AIGC)與模擬技術深度融合。
模擬技術本身並不罕見,但單靠模擬技術生成的數據真實度、泛化性與效率較低,通俗來講就是“不够真實”,囙此無法解决現有難點,還需探索如何與生成式人工智慧相結合。謝晨結合自己負責的自動駕駛業務,開始驗證兩種科技融合的可能性。
經過反復驗證,謝晨用了5年時間,終於摸索出了生成式人工智慧與模擬技術最佳融合方法,由此可以生成映射現實世界的合成數據——影像或視頻,通過訓練算灋理解和學習現有數據便可生成3D、物理真實、可泛化的新數據。
幫助中國企業追趕特斯拉
2023年,帶著自己的研究成果,謝晨毅然决定從蔚來汽車辭職創業。
“我們希望,通過合成數據的應用,助力中國汽車企業在自動駕駛科技上縮小與特斯拉的差距,甚至實現超越。”謝晨解釋道,特斯拉現在在全球擁有上百萬輛汽車,它們源源不斷地傳回數據、幫助人工智慧不斷優化。而中國車企掌握的數據可能只有特斯拉的百分之一,長此以往,雙方的人工智慧差距也會拉大。
“啟數光輪可以提供海量合成數據,相當於加了一個杠杆,來填補中國車企在真實數據量上與特斯拉的差异。”謝晨說,啟數光輪成立後完成的第一單業務,就很好地證明了合成數據的價值。
在業務拓展過程中,有汽車廠商告訴謝晨,企業正在研製的自動駕駛有個問題始終難以解决,就是會將路邊看板的人物圖案識別為真人進而啟動刹車。如果修改識別規則,又無法鑒別真正的行人,容易造成交通事故。
“其實這裡的問題就在於企業缺乏足够多的路况數據。”謝晨的團隊拿下這一單,生成了數千個包含人像廣告的各類場景,並從中挑選出帶有精確標注的數據。這些數據隨後被該車企用於算灋訓練,果然有效增强了自動駕駛模型的表現。
由此,啟數光輪在業界嶄露頭角,作為一家初創企業在業內迅速打響了名氣。成立一年多,就獲得了四輪融資,得到了多家頭部創投機构的認可。
推動人工智慧相關產業發展
從在大企業做創新研發,到自主創業,謝晨坦言,這一年多的經歷給了他很大挑戰,也讓他感到十分興奮。
從一開始,他就給自己的新公司定了一個長遠的目標:成為數據界的英偉達。對此,謝晨很有信心。“我們有一個很棒的團隊,平均年齡28歲,來自合成數據、生成式人工智慧、模擬等領域的優秀科技人員占比超過90%,還有商業領域的人才。”
現時,啟數光輪在謝晨的主導下搭建了國際領先的合成數據產線,擁有多項國內外科技專利,為多家海內外知名自動駕駛公司、國內外主機廠提供產品交付並形成合作夥伴關係,累計服務客戶幾十餘家,交付數據上億幀,積累場景數百萬個。
“使用合成數據訓練人工智慧已經是矽谷的共識,但國內對這塊認識還不够。”謝晨希望,通過啟數光輪的一系列成功案例,讓更多人意識到合成數據的價值,推動自動駕駛、具身智慧等相關產業蓬勃發展。
評論留言