申請試用
登錄
新聞中心

國內首家!中國信通院多模態大模型首輪評估,商湯「日日新」獲最高評級

2025-06-11

近日,中國信息通信研究院(以下簡稱「中國信通院」)完成可信AI多模態大模型首輪評估。商湯日日新SenseNova融合模態大模型在所有模型中獲得當前最高評級——4+級,成為中國首個獲得最高評級的大模型。


商汤-多模态测试证书_00.png


可信AI多模態大模型評估2025年1月啟動,由中國信通院人工智能研究所牽頭,依據由業界60餘家單位共同編制的《多模態大模型技術要求和評估方法》標準開展,是中國最具影響力和權威的多模態大模型測評之一。

評估包含基礎能力、理解能力、生成能力、專項測試四個模塊,共計2個能力域,30餘個能力項,為多模態大模型的技術研發、應用落地等方面提供規範與指導。

結果顯示,在基礎能力方面,商湯日日新融合模態大模型在多模態融合、多模態轉換、跨模態感知、跨模態理解、跨模態生成能力項中表現優異,具備扎實的技術能力。在模型應用方面,商湯日日新融合模態大模型在行業覆蓋度、場景支持度、應用形態多樣性、易用性能力項中表現優異,具備穩健的應用能力。

早在今年1月,商湯科技推出日日新融合大模型,在行業率先實現原生融合模態,引領了大語言模型和多模態大模型的一統化大潮。今年4月,商湯升級日日新SenseNova V6版本,通過多模態長思維鏈訓練、全局記憶、強化學習等關鍵技術,實現多模態推理能力突破。由此商湯日日新V6可自然融合文本、圖像、視頻、語音等多形態信息,解決複雜場景下的綜合問題。

例如,在實時音視頻交互方面,商湯日日新V6擁有強大的實時交互、視覺識別、記憶思考、持續對話和複雜推理等能力,能幫助AI與人類更自然、更流暢地交流,帶來創新人機交互體驗。在視頻生成方面,商湯日日新V6具備多模態視頻解析能力,支持10分鐘級視頻全幀率解析,並可根據解析內容產出新的視頻內容。

目前,商湯日日新大模型已在教育、金融、工業等多個領域實現場景落地。此次首批通過可信AI多模態大模型評估並獲最高評級認證,意味著商湯日日新不僅已具備行業領先的多模態推理能力,還能很好地滿足各行各業真實場景中對模型通用性、泛化性和專業性的嚴格要求,為行業可信發展提供堅實基礎。