靈活使用科研經費、採用中長期綜合評價機制上海期智研究院為基礎研究營造更好環境

上海 49℃ 0
摘要:市科委基礎研究處處長宋揚說。據介紹,上海期智研究院採用以創新績效為覈心的中長期綜合評價機制,項目中期考核週期為3年。

  記者俞陶然

  “喂,小星,我在二校門,幫我拿一頂學士帽過來,快點啊。”上海期智研究院PI(首席研究員)、清華大學交叉資訊研究院助理教授陳建宇向記者展示的視頻裏,可愛的人形機器人“小星”能雙足行走,未來可以幫人完成取物品、做燒烤等各種任務。

  近日,這款機器人亮相2023世界人工智慧大會,引起很多科技界、投資界人士的關注。圖靈獎得主、上海期智研究院院長姚期智院士在大會上表示:人工智慧領域下一個重大挑戰將是實現“具身通用人工智慧”,也就是研究如何構建出高端機器人,讓它通過自我學習掌握各種技能,能執行現實生活中的通用任務。

  陳建宇等青年科學家得到了上海期智研究院提供的經費、人才、成果轉化等多方面支持,為他們從事人工智慧等基礎研究營造了更好的環境。“我在清華和期智研究院都有團隊,研究院的全力支持,會加速我們的研發行程。”陳建宇說。

  信任科學家給予科研自主權

  上海期智研究院是一家事業單位性質的新型研發機構,實施“三不機制”,即不明確機构規格、不核定事業編制、不受崗位設置和工資總額限制。與傳統的事業單位相比,這家研究院在科研經費使用上有更大的靈活度。“我們實行負面清單管理,支持期智研究院圍繞既定的目標任務,根據科研活動實際需要,將財政經費用於人員、設備、試驗、交流等方面,具體如何使用由研究院自主决定。”市科委基礎研究處處長宋揚說。

  這種自主權給予科學家充分的信任,也體現了政府在競爭性科技專案之外,支持基礎研究的路徑探索。

  陳建宇就是這種制度創新的一比特受益者。在上海期智研究院,他的團隊獲得了穩定的課題經費支持,基本保障了科研需求,囙此可以將申請競爭性項目的時間用於基礎研究。上海期智研究院的課題申請流程精簡,重點考核PI團隊的研究興趣是否與研究院主要發展方向一致,且是否具備一定的研究基礎。課題的申請—立項週期較短,經費使用採取包乾制,允許PI根據實際科研情况調整各科目的經費。在評估環節,研究院充分考慮基礎研究的特點,對各個PI團隊進行差异化的績效評價,更注重科研成果的創新性和國際影響力。

  談及自己的課題,陳建宇說:“通用人工智慧是人類的一個夢想,它像人一樣可以幹很多事,不再局限於某些特定任務。ChatGPT只能處理文字資訊,而我們認為,未來的通用人工智慧需要具身的物理實體,要有眼睛、耳朵、手和脚,從而在物理世界與人更好地互動。”

  軟硬體攻關讓機器人靈活有力

  陳建宇認為,“具身通用人工智慧”的最佳載體是人形機器人,因為人類社會就是由人類、為人類建造的,擁有人的形態和人體基本功能後,機器人可以便捷地進入各種人類工作和生活場景,雙腿步行或跑步,雙手使用工具,用手指進行精細化操作。

  未來,當裝有人工智慧大模型的人形機器人投入商用,我們的社會將發生巨變——機器人可以從事一些過去只有人類才能做的工作,它們不知疲憊,專注度也不會下降;它們還將進入家庭,從事家政、護理、教育等服務。

  面對美好的未來夢想,人形機器人“小星”研發計畫應運而生。陳建宇介紹,這種機器人在硬體和軟件層面的科技要求都非常高,將步行、移動導航、手部操作等幾乎所有的機器人功能集成到一起,而且要相互配合。

  比如在手和腿協調性方面,當人工神經網路同時發出手和腿的控制指令後,機器人的手部動作可能影響雙腿行走,導致摔倒。為此,他帶領團隊在軟件層面進行攻關,研發出一種去中心化的機器人控制管道。它能自動分析神經網路發出的指令,將手和腿部的運動指令解耦開,但不會解耦左腿和右腿等需要協同的運動。這樣一來,機器人就能一邊走一邊進行手部操作。

  在硬體層面,他帶領團隊採用“本體感知驅動器”這一新的技術路線,將高扭矩密度的電機與低减速比的减速器、電流環力控、動態雙足行走算灋相結合,使機器人具有力量大、移動靈活等高性能,而且製造成本較低。“電機扭矩密度是評估人形機器人硬體效能的一項重要名額,這個名額高,說明機器人力量大,同時還能靈活移動。”陳建宇說,“現時,學術界在這個名額上做得最好的是加州大學洛杉磯分校和麻省理工學院,達到38牛·米/千克。‘小星’的扭矩密度是30牛·米/千克,我們在開發的第二代‘小星’將達到34牛·米/千克。”

  中長期評估讓科學家潜心研究

  2023世界人工智慧大會上,“小星”的亮相引起了很多與會者的關注。1.2米的個頭、白色的機身、步行速度0.7米/秒,這款機器人萌態可掬。

  這是第二代“小星”人形機器人。陳建宇團隊正在快速進行軟硬體反覆運算,以後的“小星”會更高大、步行速度更快。在上海期智研究院的算力支持下,他們開展了物理模擬實驗,模擬顯示“小星”的奔跑速度極限可達4米/秒。

  通過模仿人類動作的强化學習,這款機器人不僅能學會走路,還能學會雙手配合完成任務,如左手抓住一個球並把它移交到右手、雙手一同拎起一口鍋。

  强化學習解决的是人形機器人執行層問題,作為決策層的任務規劃,則由大語言模型負責。將人形機器人與大語言模型結合後,會遇到一個難題——大模型規劃的任務不一定得到很好執行。為此,陳建宇團隊在決策層、執行層之間加入了自動監控系統。這個系統由視覺語言模型組成,能自動監測並推理任務執行情况。比如在執行搬箱子任務時,機器人手中的箱子如果掉了,自動監控就能檢測出來,並向機器人發出“撿起箱子”的指令。

  他們還通過訓練改進了大語言模型本身,使其學會了主動提問,以提高機器人執行任務的效率。比如,當機器人被要求到一個不熟悉的房間找東西時,它會問房間的主人:“您知道這件東西在哪裡嗎?”而不是直接進房間翻箱倒櫃。

  據介紹,上海期智研究院採用以創新績效為覈心的中長期綜合評價機制,項目中期考核週期為3年。這一評估機制給了陳建宇等青年科學家充裕的時間,讓他們可以潜心研究,為人形機器人未來進入家庭和工作場所奠定堅實的科學基礎。

評論留言

  • 熱心網友
    暫時沒有留言

我要留言

◎歡迎參與討論,請在這裡發表您的看法、交流您的觀點。【所有評論需要人工稽核後才能顯示,請勿發佈垃圾資訊】