- 商湯資訊
國內第一!商湯日日新 V6.5 奪下多模態大模型 2025 年度收官之戰
國內第一,商湯日日新 V6.5 奪下 2025 年多模態大模型收官之戰!
近日,權威大模型評測基準 SuperCLUE 發布《中文多模態視覺語言模型測評基準 12 月報告》,商湯日日新 V6.5(SenseNova V6.5 Pro)以 75.35 的總分位居國內第一、斬獲金牌,更在視覺推理維度拿下國內最高分。

商湯日日新 V6.5 領跑國內陣營 全球競爭力凸顯
本次評測涵蓋基礎認知、視覺推理與視覺應用三大維度、二十項細分任務。
測評結果顯示,商湯 SenseNova V6.5 Pro 最新版本以 75.35 分拿下國內模型第一,領先 Doubao-seed-1.6-vision、ERNIE-5.0、Qwen3 等產品。與此同時,以商湯日日新為代表的國產模型,正大幅拉近與國外頭部模型的差距,全球競爭力實現顯著提升。

在各維度能力對比中,報告指出,商湯日日新 V6.5 等國產模型在基礎認知維度已接近頭部平均水準,部分產品更與 Gemini 3.0 Pro 看齊。而在視覺推理維度,國產模型中僅有商湯日日新 V6.5 超越頭部平均水準,處於行業領先地位,其餘國產模型仍存在明顯差距。
具體來看,商湯日日新 V6.5 共在七項細分任務中拿下國內第一,其中物體描述、文字辨識、環境辨識、邏輯推理、程式設計、自動駕駛領域六大細分任務並列國內第一,科學推理任務更斬獲 79.17 分,為國內最高分。
此外,在表情辨識、3D 物體辨識、數學推理、工業應用能力、醫療影像分析、圖形介面理解、內容審核等細分任務中,商湯日日新 V6.5 亦有優異表現,整體位居國內模型第一梯隊,展現出全面的多模態認知、推理與應用能力。
堅持底層創新 以用戶價值引導模型迭代
多模態領域的突圍,是商湯堅持「多模態通用智能」技術戰略、以底層創新突破產業發展瓶頸的有力印證。
從創新的模型架構、數據壁壘的打通,到訓練範式的革新,商湯日日新大模型持續拓展多模態大模型的能力邊界。
今年,商湯更發布並開源 NEO 多模態架構,重構視覺與語言的融合機制,實現內生多模態能力,僅用 1/10 的數據就達到同量級多模態模型的最佳水準;同時,透過結合多模態數據整合,以及超越 Next Token Prediction 的突破性跨視角預測(Cross-View Prediction)訓練範式,商湯日日新在空間智能的表現上,已超越 GPT-5、最新版 Gemini-3 Pro 及 Cambrian-S。此外,商湯基於演算法、系統、模型、架構多層面的聯合創新,實現成本與效率的雙重突破。
本月「商湯產品發布周」期間,商湯發布多款基於日日新大模型的 AI 應用與產品,為影片創作、AI 辦公、電商直播、具身智能乃至大眾日常生活等領域,帶來效率提升與智能化體驗升級,推動 AI 實現從「生產力工具」向「生產力」的躍遷。






返回