- 商湯資訊
想法流x商湯科技大裝置 端到端全棧賦能 造就「造夢次元」達現象級應用
香港,2025年6月18日 ─ 商湯大裝置作為「最懂大模型的AI基礎設施」,成功為想法流提供了從算力到模型的全鏈路一體化AIGC整體解决方案,一站式支撑想法流的産品研發及運營需求,讓其打造的「造夢次元」成為多模態AI驅動的新一代內容平台,日均活躍互動時間超過100分鐘,是大量年輕用戶娛樂、情感表達和學習陪練的重要夥伴,造就現象級應用。
由想法流打造的「造夢次元」,每日平均模型調用量高達6,000多萬次,一天消耗的token達千億級別。在如此龐大的規模下,任何卡頓、當機、出錯都會導致嚴重的用戶流失。受惠於商湯大裝置的端到端支持,通過算力、模型和應用之間的緊密協同,「造夢次元」不僅創造了最佳的用戶體驗,成本效益亦能實現最大化,主要體現在以下四個層面:
l 秒級彈性應對,成本下降50%:面對流量波動挑戰,商湯大裝置通過實時監測、統一調度、智能擴縮容的組合策略,實現秒級彈性應對,讓想法流的整體運營成本降低50%。其中,智能化統一調度結合監測系統實時抓取的業務指標,根據推理業務擴縮容規則自動分配資源,實現算力與流量的精準匹配;並結合定時擴縮容與按需擴縮容的雙重策略,提升靈活性
l 全鏈路優化:想法流以「人均互動次數」作為判斷模型體驗的綜合指標,推理時延和每秒查詢率(QPS)正是影響該指標的關鍵因素。商湯大裝置通過硬件資源、軟件框架、算法模型等多維度協同優化,使推理時延降低三至五倍。另外,在秒級彈性應對的基礎上,商湯大裝置還通過全鏈路量化加速、流量分級與降級等專項優化,在高峰期優先保障高價值業務的響應速度,將QPS提升100%,最大化用戶體驗。
l 「人均互動次數」翻倍提升:商湯透過日日新多模型組合,包括商量語言大模型、商量擬人對話模型、文生圖模型秒畫等多模型組合,為「造夢次元」的用戶帶來「更懂人心」的交互體驗。其「人均互動次數」已從初期 20 輪提升至 40至50 輪,用戶粘性大幅增長。
n 商量語言大模型:以精準的上下文語義分析、意圖推理及對人類情感的細緻感知與回應,助力「造夢次元」以擬人化思維打造沉浸式交流體驗。
n 商量擬人對話模型:以領先的角色對話、人設、及劇情推動能力,幫助想法流用戶打造IP角色,為用戶提供高擬真對話體驗。短短兩年時間,「造夢次元」已發展成為擁有數百個萬粉級別IP角色。
n 文生圖模型秒畫:創作者可使用秒畫的普通生圖、CN生圖、換臉、擴圖等功能,進行各類虛擬角色設計。
l 可靠全面穩定性保障:針對想法流高頻次的模型切換,以及開源模型頻繁的版本升級給業務運營帶來的穩定性挑戰,商湯大裝置針對推理階段構建了涵蓋模型灰度發佈、滾動升級與智能運維的全面穩定性保障體系,不僅為模型快速迭代提供了有效支撑,也確保了在線業務的穩定運行。
想法流合夥人、Studio負責人張鴻表示:「商湯大裝置展現出三重核心優勢:一是算力與模型的深度協同,實現最高效的資源利用;二是針對文本、語音、圖像等不同模態的協同,構建了流暢自然的交互體驗;三是支持開源模型的完善生態,提供了多樣化模型選擇。這種多維度協同優勢助我們推動技術效能向商業價值的高效轉化。」
商湯科技聯合創始人、大裝置事業群總裁楊帆認為:「商湯大裝置與想法流的合作,是對商湯科技『大裝置-大模型-應用』三位一體戰略價值的最佳詮釋。基於應用場景特點開展模型能力共創,訓練高度貼合業務需求的垂類模型,並針對模型調用需求提供最優的基礎設施支持,最終實現降本增效和用戶滿意度的提升。未來,雙方將聚焦多模態模型能力深化合作,給用戶帶來更新奇、更有趣的AI互動之旅。」