- 新聞中心
商湯「日日新V6」再奪雙冠 多模態能力全球第一 通用語言能力列國內榜首
商湯「日日新」大模型在半年內第二次斬獲「雙料冠軍」。此次成功衛冕「雙冠」 — 同時在通用語言和多模態兩大權威榜單中奪冠,意味著商湯「日日新 V6」已成為全球最領先的大模型之一,持續引領多模態大模型突破AI能力邊界。
5月28日,權威大模型測評機構SuperCLUE《中文大模型基準測評2025年5月報告》出爐,商湯「日日新 V6」(SenseNova-V6 Reasoner)憑藉出色的綜合能力表現,以62.96分的優異成績,與Doubao-1.5-thinking-pro並列國內第一,並在智能體Agent測試任務中獲得國內最高分。
同時,根據全球最大的AI開源社區Hugging Face上的數據,在 OpenCompass本月的多模態大模型評測榜單中,商湯「日日新V6」(SenseNova-V6 Pro)以80.4的總分位居第一,超越Gemini 2.5 Pro。
今年年初,商湯「日日新」就以同一模型,在SuperCLUE《中文大模型基準測評2024年度報告》評測和OpenCompass多模態評測中獲得雙料冠軍,引領了業界大語言模型和多模態大模型的一統化大潮。
憑藉多模態長思維鏈訓練、全局記憶、強化學習等技術創新,商湯「日日新 V6」以單一模型即可完成文本、多模態等多種任務,在推理、數理、代碼等方面擁有顯著優勢,能夠深度理解人類意圖,處理各類複雜資訊和問題,為真實的業務應用提供強大助力。同時,商湯「日日新 V6」的多模態訓練整體效率對齊語言訓練,實現業內最高水平,推理成本亦達到業界最低。
受惠於高效能與低成本的完美結合,商湯「日日新 V6」自今年4月發佈以來,獲得行業各界廣泛支持,已在具身智能、智慧教育、智慧文旅等領域攜手多家合作夥伴,將共同推動多行業、多場景落地。
秉承「大裝置-大模型-應用」三位一體的發展戰略,商湯科技通過AI基礎設施系統與模型演算法的聯合優化,不斷提升模型的多模態和深度思考能力,持續降低訓練與推理成本,推動生成式AI飛速發展,快速融入「百姓之日用」。