資訊與博客

商湯科技日日新SenseNova 4.0 發布，帶來全新的AI體驗

2024-02-02

商湯科技發布「日日新SenseNova 4.0」，全面升級大模型體系。「日日新SenseNova 4.0」擁有更全面的知識覆蓋、更可靠的推理能力，更優越的長文本理解力、及更穩定的數字推理能⼒，以及更強的代碼生成能力，同時跨模態交互。日日新·商量大語言模型-通用版本（SenseChat V4），支持 128K 語境窗口長度，綜合整體評測成績水平媲美 GPT 4，更全面超逾 GPT 3.5。（API申請網址：https://platform.sensenova.cn/）

商湯亦率先推出支援不同模態工具調用的日日新·商量大語言模型 Function call & Assistants API 版本，為先進的大模型與各類應用服務工具的連接提供便利橋梁，顯著降低開發者使用大模型的門檻。

商湯也將先進的大模型能力轉化為落地實際場景的產品應用，基於最新發布的日日新·商量大語言模型 Function call & Assistants API 完成開發並正式發佈數據分析工具「辦公小浣熊」。

目前，憑借豐富的 AI 技術能力，商湯「日日新 Sense Nova」大模型體系以低成本、高效率打通了各類 AI 應用，提供包括面向辦公場景的商湯日日新·商量語言大模型-數據分析版本、面向醫療場景的日日新·商量語言大模型-醫療版本「大醫」、面向自動駕駛及工業場景的日日新·商量多模態大模型，以及面向創作創意場景的日日新·秒畫文生圖大模型等豐富的工具。

商湯「日日新·商量大語言模型」在金融、手機、醫療、汽車、地產、能源、傳媒、工業製造等眾多垂直行業，已與超過 500 家客戶建立深度合作，加速行業企業的智能化轉型。

接下來，商湯「日日新 SenseNova」大模型體系及相關產品和工具為實現通用人工智能 (AGI)提供了精准著力點，助力全場景、多產業實現「大模型+」，拓寬大模型應用邊界。

「節前大上新」！超豐富大模型體系，AI能力隨取隨用

「日日新SenseNova 4.0」提供了多種靈活的API接口和服務，開發人員可以根據實際應用需求，輕鬆地調用日日新SenseNova大模型的各項AI技術能力，以更低成本、更高效率實現各類AI應用。

大模型性能提升的基礎，在於語言建模能力的增強。「日日新SenseNova4.0」全新升級商量大語言模型-通用版本（SenseChat V4），目前支持4k、32k、128k tokens不同窗口，拓展了模型應用範圍。SenseChat V4 顯著提升了在知識理解、閱讀理解、綜合推理、數理、代碼和長文本理解等領域的通用能力，綜合整體評測成績水平比肩GPT-4 ，其中推理和代碼編程的測評表現更是超越了GPT-4。於權威測試集HumanEval Coding的測試中，一次通過率達到75.6%（GPT-4此項數據為74.4%）。

基於大模型評測平台OpenCompass全集測試，日日新·商量大語言模型SenseChat V4，綜合整體評測成績水平比肩GPT-4

Screenshot 2024-02-02 at 21.14.01.png

商湯日日新·商量語言大模型-數據分析版本（SenseChat-DataAnalysis V4）正式發佈，在數據分析場景下的數據測試集（1000+題目）中以85.71%的正確率超過GPT-4，支持複雜表格、多表格、多文件的理解，實現數據清洗、數據運算、比較分析、趨勢分析，預測性分析、可視化等常見數據分析任務，賦能財務分析、商業分析、銷售預測、市場分析、宏觀分析等多個應用場景。

商湯推出的日日新·商量語言大模型-醫療版本：「大醫」（SenseChat-Medical V4），在本次更新中實現了更強的多輪對話與上下文理解能力、以及更豐富的工具調用能力，有效實現專業醫學問答及複雜醫學任務推理，並支持更多模態醫學文件的智能解讀和交互問答。「大醫」在兩項行業權威評測——2023年職業藥劑師考試大模型評測、中文醫療大語言模型開放評測平台MedBench中，實現綜合評分排名第二，性能逼近GPT-4，其中職業藥劑師考試大模型評測中的兩個細分方向性能已超越GPT-4。

2023年職業藥劑師考試大模型評測結果，「大醫」綜合評分排名第二，並在兩個細分方向上性能超越GPT-4

覆蓋13個醫學場景的大醫Web端展示頁面

多模態是人工智能大模型重要的技術演進方向，日日新·商量多模態大模型（SenseChat-Vision V4）正式推出，其擁有300億參數，圖文理解能力處於全球領先水平，在權威評測基準測試集MME Benchmark上綜合得分排名首位，綜合得分達2199.5（超過GPT-4V的1926.57），已在智能駕駛、智能車艙、電力行業等多個實際場景落地應用，助力千行百業的產業升級。

多模態大模型權威綜合基準測試MME Benchmark可以從定位、名人識別、景點識別、OCR、數學計算等14個維度來系統綜合評測模型的能力。

日日新·商量圖文多模態大模型可回答交通場景中圖文內容理解等複雜任務

商湯自研的日日新-秒畫文生圖大模型（SenseMirage V4）較此前版本，參數量提升至百億量級，通過Mixture of text experts、Spatial-aware CFG等算法優化，語義理解能力與圖像質感細節表現顯著增強，可達成電影級海報生成水平。同時結合Adversarial Distillation算法，秒畫SenseMirage-Turbo加速版也正式對外發布，相較於基礎版本，可達到10倍推理加速效果。