- 商湯資訊
商湯首度發佈「悟能」具身智能平台 AI在物理世界中實現自我進化
香港,2025年7月28日 ─ 7月27日,在商湯科技承辦的「大愛無疆‧模塑未來」WAIC 2025大模型論壇上,商湯科技正式發佈「悟能」具身智能平台。在商湯視覺感知、大裝置、日日新大模型等多種技術的穩固基礎上,該平台以「開悟」世界模型為核心引擎,依託商湯大裝置提供強大的端側和雲側算力作支援,能夠為機器人、智能設備賦予強大的感知、視覺導航及多模態交互能力,推動智能終端機向更高層次的自主化與智能化演進。
商湯科技董事長兼首席執行官徐立表示:「世界模型和具身AI的結合,將開啟AI發展的下一個階段,完成由『工具』向『人』的躍遷,加速邁向AGI時代。商湯希望『悟能』具身智能平台能夠幫助各類具身智能企業,幫助他們完成和現實世界交互的夢想。」
感知全能、導航精准、交互靈活 為具身智能打造「三大核心引擎」
感知、導航和交互,是具身智能的三大核心能力。商湯科技在這三大方面均擁有深厚的技術積澱,並將這些技術轉化成了「悟能」具身智能的能力。該平台可廣泛適配包括汽車、機器人在內的各類終端,實現空間層面的現實世界互動。
首先,感知是機器探索現實世界的基礎。憑藉商湯方舟在視覺AI領域十餘年的深耕積累,從機器狗到機器人,「悟能」具身智能平台能為各類終端硬體賦予對萬物的識別與理解能力,同時具有強大的場景適配性,可完全嵌入端側晶片實現端側推理,讓感知更高效、回應更敏捷。
無論是機器狗的視角還是機器人的視角,都能對外界有整體的天然感知識別,對物體形成自然劃分切割。
導航是機器在現實世界中行動的「骨架」。商湯絕影在純視覺端到端智能輔助駕駛方案上的技術積累,可泛化適配至機器人、機器狗等硬件設備,讓機器人在更多樣的環境中實現精準路徑規劃與導航。
同樣,無論是在綠化小路中四足奔走的、體型較小的機器狗還是行駛在城區正常車道的自動駕駛車輛,都在實現精準路徑規劃與導航的同時,準確地進行了自動避障。
交互是機器與現實世界連接的橋樑。基於「日日新」大模型的技術積累與不斷反覆運算,「悟能」具身智能平台可以賦能機器人具備和現實世界的交互能力,具備有溫度、有深度、長記憶、超穩定等能力亮點。
以AI生成的《長安的荔枝》電影介紹PPT為例,由「悟能」具身智能平台賦能的人形機器人,能夠以各種風趣幽默、嚴謹務實等各種語言風格進行生動講解。
構建4D真實世界 為機器進化提供高品質現實世界數據
基於強大的多模態深度理解能力,同樣是商湯推出的「開悟」世界模型具備合理的空間一致性和時間一致性,可生成高品質資料,有效提升具身智能等終端設備的智能水平。「開悟」世界模型能夠僅憑自然語言描述,即可生成逼真的七路攝像頭視角模擬數據,且不同視角下的幾何位置高度對應,完全符合物理世界的規律。
「開悟」世界模型還能夠編輯真實世界,可對現實世界中的車輛等場景元素進行替換、刪除、增補,創造更加多樣的現實場景。
小汽車變成貨車:原視頻
小汽車變成貨車:替換
基於強大的生成和編輯能力,「開悟」世界模型可以精準模擬方向盤、刹車和油門控制,帶來如同在真實的街道場景中玩「極品飛車」的效果,讓機器在現實世界中自由探索。
相較於智能汽車,機器人適用和覆蓋的場景更加廣泛,能夠通過主動探索生成更多高品質的現實世界資料,在具身智慧資料匱乏的當前環境下,可通過構建面向人、物、場的4D真實世界,突破模型泛化能力的邊界。
未來,商湯科技將助力賦能具身智能企業實現感知、理解與生成能力的躍進,將具身交互的不確定性挑戰轉化為產業升級的確定性路徑,推動AI向下一個十年加速進化。
如欲參閱更多相關訊息、示範圖片及影片,歡迎瀏覽:https://mp.weixin.qq.com/s/7CIz_rJWQT0PNOEVLfnt-g