申請試用
登入
商湯資訊

商湯「日日新」於OpenCompass全球多模態大模型學術排名榜摘冠

2025-09-11

上海人工智能實驗室權威評測平台OpenCompass發佈的多模態大模型學術榜單(Multi-modal Academic Leaderboard),最新數據顯示,商湯「日日新 V6.5」(SenseNova-V6.5 Pro)多模態大模型以82.2的綜合成績成為榜首,領先Gemini 2.5 Pro以及GPT-5等國際頂尖模型。


 0.png

這意味著商湯「日日新 V6.5」成爲全球最强多模態(同時理解文字、影片、圖像、聲音等資料)大模型之一,同時也印證商湯「多模態通用智能」技術戰略的成果。商湯科技聯合創始人、執行董事兼首席科學家林達華指出,智能的核心是與外界進行自主互動的能力,多模態信息感知與處理的能力是通用人工智能(AGI)的核心要求,使AI能像人類一樣,通過視覺、聽覺等多種感官接收並融合信息,實現更深層次的理解與推理,是邁向AGI的必經之路。


商湯「日日新V6.5」正是商湯科技以多模態爲技術主軸下的最新成果。在國內率先突破「圖文交錯思維鏈」技術,「日日新V6.5」能够像人一樣,實現邏輯思維和形象思維的結合,可將部分思考過程轉化爲圖形化表達,具備真正的多模態思考能力,成爲中國首個擁有形象思維,實現圖文交錯思維的商業級大模型。


同時,憑藉以思維鏈爲載體、强化學習爲主要途徑的新範式,「日日新V6.5」能够在「生成-驗證-學習」的算法閉環中持續改進自身的思維,推理性能大幅提升,其中在數理、代碼、GUI操作、圖表分析、高階任務等維度的提升尤爲顯著。

商湯「日日新V6.5」還通過架構更新,採用輕量化的視覺編碼器,同時加深MLLM主幹網絡,在保證同樣性能的前提下,實現3倍以上的效率提升,使性能成本曲綫顯著優化,效費比優於Gemini 2.5等國際模型。


在以多模態通向AGI的過程,商湯科技以「基礎設施-模型-應用」三位一體的總體戰略,致力於打造業界領先的通用多模態大模型,並在真實場景牽引下,構建端到端的産品技術競爭力。以不斷進化的多模態大模型能力爲基礎,商湯科技持續推動多模態AI從數字空間走入真實的物理世界,在真實場景中提供端到端的價值。


OpenCompass大模型開放評測體系是上海人工智能實驗室推出的一站式、大模型評估平台,致力於提供公平、開源、可複現的評測標準,覆蓋了語言、多模、安全、具身智能、金融與醫療等多個方面通用能力和垂類領域評測,是對大模型真實能力各個維度進行全面診斷的專業綜合榜單。多模態模型公開學術榜單精選國內外具有廣泛影響力的開源學術評測集,對行業多模態模型進行評測,採用主客觀評測相結合的評測手段,運用了CircularEval、LLM-as-a-Judge等策略,被業界視爲反映大模型「應用價值」的重要參考。


OpenCompass 多模態模型公開學術排名榜:https://rank.opencompass.org.cn/leaderboard-multimodal/?m=REALTIME