資訊與博客

商湯「日日新」於OpenCompass全球多模態大模型學術排名榜摘冠

2025-09-11

上海人工智能實驗室權威評測平台OpenCompass發佈的多模態大模型學術榜單（Multi-modal Academic Leaderboard），最新數據顯示，商湯「日日新 V6.5」（SenseNova-V6.5 Pro）多模態大模型以82.2的綜合成績成為榜首，領先Gemini 2.5 Pro以及GPT-5等國際頂尖模型。

這意味著商湯「日日新 V6.5」成爲全球最强多模態（同時理解文字、影片、圖像、聲音等資料）大模型之一，同時也印證商湯「多模態通用智能」技術戰略的成果。商湯科技聯合創始人、執行董事兼首席科學家林達華指出，智能的核心是與外界進行自主互動的能力，多模態信息感知與處理的能力是通用人工智能（AGI）的核心要求，使AI能像人類一樣，通過視覺、聽覺等多種感官接收並融合信息，實現更深層次的理解與推理，是邁向AGI的必經之路。

商湯「日日新V6.5」正是商湯科技以多模態爲技術主軸下的最新成果。在國內率先突破「圖文交錯思維鏈」技術，「日日新V6.5」能够像人一樣，實現邏輯思維和形象思維的結合，可將部分思考過程轉化爲圖形化表達，具備真正的多模態思考能力，成爲中國首個擁有形象思維，實現圖文交錯思維的商業級大模型。

同時，憑藉以思維鏈爲載體、强化學習爲主要途徑的新範式，「日日新V6.5」能够在「生成-驗證-學習」的算法閉環中持續改進自身的思維，推理性能大幅提升，其中在數理、代碼、GUI操作、圖表分析、高階任務等維度的提升尤爲顯著。

商湯「日日新V6.5」還通過架構更新，採用輕量化的視覺編碼器，同時加深MLLM主幹網絡，在保證同樣性能的前提下，實現3倍以上的效率提升，使性能成本曲綫顯著優化，效費比優於Gemini 2.5等國際模型。

在以多模態通向AGI的過程，商湯科技以「基礎設施-模型-應用」三位一體的總體戰略，致力於打造業界領先的通用多模態大模型，並在真實場景牽引下，構建端到端的産品技術競爭力。以不斷進化的多模態大模型能力爲基礎，商湯科技持續推動多模態AI從數字空間走入真實的物理世界，在真實場景中提供端到端的價值。

OpenCompass大模型開放評測體系是上海人工智能實驗室推出的一站式、大模型評估平台，致力於提供公平、開源、可複現的評測標準，覆蓋了語言、多模、安全、具身智能、金融與醫療等多個方面通用能力和垂類領域評測，是對大模型真實能力各個維度進行全面診斷的專業綜合榜單。多模態模型公開學術榜單精選國內外具有廣泛影響力的開源學術評測集，對行業多模態模型進行評測，採用主客觀評測相結合的評測手段，運用了CircularEval、LLM-as-a-Judge等策略，被業界視爲反映大模型「應用價值」的重要參考。

OpenCompass 多模態模型公開學術排名榜：https://rank.opencompass.org.cn/leaderboard-multimodal/?m=REALTIME

您尚未完善信息

完善信息后，即可下载资料

完善信息跳过，继续浏览

您尚未登录

您还未登录，登录方可继续

登录跳过，继续浏览

请选择您认为需要改进的地方：

导航不好用，不方便找到感兴趣的内容
产品介绍信息不够全面
产品介绍信息不容易懂
页面打开速度不快，页面浏览不流畅/有卡顿
页面不够美观
售后服务不好找，体验不好

跳过下一个

您是否能够达到本次网站的访问目的？

是
否
仍在进行中

下一个

您对商汤官网的满意度如何？

非常不满意非常满意

提交

已收到您对商汤官网的评价和建议！

感谢您的耐心反馈~

关闭

您还未登录，登录方可继续

登录跳过，继续浏览

您尚未完善信息

完善信息后，即可下载资料

完善信息跳过，继续浏览

申请试用

技術能力

商湯研究

商湯日日新大模型 SenseNova

SenseFoundry Enterprise 商湯方舟企業開放平台

SenseFoundry 商湯方舟城市開放平台

SenseME 水星智能移動終端平台

SenseMARS 火星混合現實平台

SenseHome 智能家居

SenseCare 商湯智慧醫院

商湯教育

SenseAuto 商湯絕影智能汽車平台

商湯「日日新」於OpenCompass全球多模態大模型學術排名榜摘冠

您尚未完善信息

您尚未登录

请选择您认为需要改进的地方：

您是否能够达到本次网站的访问目的？

您对商汤官网的满意度如何？

已收到您对商汤官网的评价和建议！

您还未登录，登录方可继续

您尚未完善信息

產品試用