申請試用
登入
商湯資訊

國內第一!商湯日日新 V6.5 奪下多模態大模型 2025 年度收官之戰 ​

2026-01-21

國內第一,商湯日日新 V6.5 奪下 2025 年多模態大模型收官之戰!


近日,權威大模型評測基準 SuperCLUE 發布《中文多模態視覺語言模型測評基準 12 月報告》,商湯日日新 V6.5(SenseNova V6.5 Pro)以 75.35 的總分位居國內第一、斬獲金牌,更在視覺推理維度拿下國內最高分。

image.png


商湯日日新 V6.5 領跑國內陣營 全球競爭力凸顯

本次評測涵蓋基礎認知、視覺推理與視覺應用三大維度、二十項細分任務。

測評結果顯示,商湯 SenseNova V6.5 Pro 最新版本以 75.35 分拿下國內模型第一,領先 Doubao-seed-1.6-vision、ERNIE-5.0、Qwen3 等產品。與此同時,以商湯日日新為代表的國產模型,正大幅拉近與國外頭部模型的差距,全球競爭力實現顯著提升。

image.png

在各維度能力對比中,報告指出,商湯日日新 V6.5 等國產模型在基礎認知維度已接近頭部平均水準,部分產品更與 Gemini 3.0 Pro 看齊。而在視覺推理維度,國產模型中僅有商湯日日新 V6.5 超越頭部平均水準,處於行業領先地位,其餘國產模型仍存在明顯差距。


具體來看,商湯日日新 V6.5 共在七項細分任務中拿下國內第一,其中物體描述、文字辨識、環境辨識、邏輯推理、程式設計、自動駕駛領域六大細分任務並列國內第一,科學推理任務更斬獲 79.17 分,為國內最高分。


此外,在表情辨識、3D 物體辨識、數學推理、工業應用能力、醫療影像分析、圖形介面理解、內容審核等細分任務中,商湯日日新 V6.5 亦有優異表現,整體位居國內模型第一梯隊,展現出全面的多模態認知、推理與應用能力。


堅持底層創新 以用戶價值引導模型迭代

多模態領域的突圍,是商湯堅持「多模態通用智能」技術戰略、以底層創新突破產業發展瓶頸的有力印證。


從創新的模型架構、數據壁壘的打通,到訓練範式的革新,商湯日日新大模型持續拓展多模態大模型的能力邊界。


今年,商湯更發布並開源 NEO 多模態架構,重構視覺與語言的融合機制,實現內生多模態能力,僅用 1/10 的數據就達到同量級多模態模型的最佳水準;同時,透過結合多模態數據整合,以及超越 Next Token Prediction 的突破性跨視角預測(Cross-View Prediction)訓練範式,商湯日日新在空間智能的表現上,已超越 GPT-5、最新版 Gemini-3 Pro 及 Cambrian-S。此外,商湯基於演算法、系統、模型、架構多層面的聯合創新,實現成本與效率的雙重突破。


本月「商湯產品發布周」期間,商湯發布多款基於日日新大模型的 AI 應用與產品,為影片創作、AI 辦公、電商直播、具身智能乃至大眾日常生活等領域,帶來效率提升與智能化體驗升級,推動 AI 實現從「生產力工具」向「生產力」的躍遷。