- 商湯資訊
亮相央視,網友力讚國産之光!商湯如影以圖片數字人技術再次破圈
在近日播出的央視人工智能産業發展大型主題活動《2025中國·AI盛典》上,由商湯如影團隊傾力打造的三位歌唱家——石倚潔、張英席、蔡程昱的AI數字分身,與本尊同台演繹經典歌劇曲目《今夜無人入眠》,並以七種語言獻唱。此外,「人工智能之父」圖靈以AI數字人的形象,貫穿盛典始終。盛典節目播出後,相關視頻全網播放量突破1億次,網友們紛紛稱讚「AI國産之光」,感嘆「真·打開了新世界的大門」,這也是商湯如影連續兩年參與這場以AI爲核心的國家級科技盛會。
如影圖片數字人技術:一張圖片,一段音頻,即可生成分鐘級高質量視頻
此次亮相的AI數字分身,源自商湯自研的如影圖片數字人技術。依托商湯日日新大模型的多模態能力,只需上傳一張人物照片,輸入文字脚本或音頻文件,AI 就能自動生成人物動態視頻,並支持多種語言,實現了與真人幾乎無差別的口型匹配、動作呼應和情緒表達。
與市面上多數停留在5-10秒短片段的圖生視頻工具不同,如影圖片數字人能够穩定生成長達3分鐘以上的動態視頻,全程保持人物 ID、背景風格的高度一致性。不僅如此,如影圖片數字人還能通過提示詞如「揮手」,精准驅動人物肢體動作,甚至支持快速大幅度手部動作,解决「動作僵硬、與內容脫節」問題。
風格形象多元 廣泛服務營銷、教育、文旅、社交娛樂等多場景
在應用層面,如影圖片數字人也展現了强大的靈活性,爲創作者和企業提供了前所未有的表達空間,支持API調用和私有化部署,保障數據安全,滿足定制化需求。真人照片、二次元動漫角色、3D虛擬形象,甚至動物玩偶,都可以作爲驅動源,AI數字人不僅能實現Rap級別的口型對準,還能根據提示展現不同的情緒和肢體動作,同時可以支持多人場景,指定人物開口對話。
在商業營銷場景中,企業只需一張員工或模特照片,就能快速生成促銷視頻或多語種産品講解,大幅降低拍攝和翻譯成本;在媒體傳播中,自媒體創作者可以用自己的照片生成口播短視頻,新聞機構也能借助3D人物圖實現多語種播報;在教育和文化領域,名師照片可以「開口」講解知識點,博物館中的歷史人物復原圖也能爲觀衆講述文物背後的故事;而在文旅行業,參觀者甚至可以通過一張照片生成屬於自己的「穿越短劇」,讓旅行體驗更具沉浸感和互動性。
這一突破,使其能够真正服務于社交娛樂、營銷帶貨、教學課程、品牌故事、文化解說等場景,打破了行業長期以來的時長瓶頸。從傳統依賴拍攝與建模,到如今「一張照片即可生成擬真視頻」,商湯正在用技術重塑數字人産業格局,讓大衆能够以更低門檻、更高效率參與到創作中。