申請試用
登錄
新聞中心

商湯科技日日新SenseNova 4.0 發布,帶來全新的AI體驗

2024-02-02

商湯科技發布「日日新SenseNova 4.0」,全面升級大模型體系。「日日新SenseNova 4.0」擁有更全面的知識覆蓋、更可靠的推理能力,更優越的長文本理解力、及更穩定的數字推理能⼒,以及更強的代碼生成能力,同時跨模態交互。日日新·商量大語言模型-通用版本(SenseChat V4),支持 128K 語境窗口長度,綜合整體評測成績水平媲美 GPT 4,更全面超逾 GPT 3.5。(API申請網址:https://platform.sensenova.cn/)

商湯亦率先推出支援不同模態工具調用的日日新·商量大語言模型 Function call & Assistants API 版本,為先進的大模型與各類應用服務工具的連接提供便利橋梁,顯著降低開發者使用大模型的門檻。

商湯也將先進的大模型能力轉化為落地實際場景的產品應用,基於最新發布的日日新·商量大語言模型 Function call & Assistants API 完成開發並正式發佈數據分析工具「辦公小浣熊」。

目前,憑借豐富的 AI 技術能力,商湯「日日新 Sense Nova」大模型體系以低成本、高 效率打通了各類 AI 應用,提供包括面向辦公場景的商湯日日新·商量語言大模型-數據分 析版本、面向醫療場景的日日新·商量語言大模型-醫療版本「大醫」、 面向自動駕駛及 工業場景的日日新·商量多模態大模型,以及面向創作創意場景的日日新·秒畫文生圖大模型等豐富的工具。

商湯「日日新·商量大語言模型」在金融、手機、醫療、汽車、地產、能源、傳媒、工業 製造等眾多垂直行業,已與超過 500 家客戶建立深度合作,加速行業企業的智能化轉型。

接下來,商湯「日日新 SenseNova」大模型體系及相關產品和工具為實現通用人工智能 (AGI)提供了精准著力點,助力全場景、多產業實現「大模型+」,拓寬大模型應用邊界。


「節前大上新」!超豐富大模型體系,AI能力隨取隨用

「日日新SenseNova 4.0」提供了多種靈活的API接口和服務,開發人員可以根據實際應用需求,輕鬆地調用日日新SenseNova大模型的各項AI技術能力,以更低成本、更高效率實現各類AI應用。

大模型性能提升的基礎,在於語言建模能力的增強。「日日新SenseNova4.0」全新升級商量大語言模型-通用版本(SenseChat V4),目前支持4k、32k、128k tokens不同窗口,拓展了模型應用範圍。SenseChat V4 顯著提升了在知識理解、閱讀理解、綜合推理、數理、代碼和長文本理解等領域的通用能力,綜合整體評測成績水平比肩GPT-4 ,其中推理和代碼編程的測評表現更是超越了GPT-4。於權威測試集HumanEval Coding的測試中,一次通過率達到75.6%(GPT-4此項數據為74.4%)。

Slide5.PNG

Slide3.PNG

基於大模型評測平台OpenCompass全集測試,日日新·商量大語言模型SenseChat V4,綜合整體評測成績水平比肩GPT-4                 

 

Screenshot 2024-02-02 at 21.14.01.png

商湯日日新·商量語言大模型-數據分析版本(SenseChat-DataAnalysis V4)正式發佈,在數據分析場景下的數據測試集(1000+題目)中85.71%的正確率超過GPT-4,支持複雜表格、多表格、多文件的理解,實現數據清洗、數據運算、比較分析、趨勢分析,預測性分析、可視化等常見數據分析任務,賦能財務分析、商業分析、銷售預測、市場分析、宏觀分析等多個應用場景。

商湯推出的日日新·商量語言大模型-醫療版本:「大醫」(SenseChat-Medical V4),在本次更新中實現了更強的多輪對話與上下文理解能力、以及更豐富的工具調用能力,有效實現專業醫學問答及複雜醫學任務推理,並支持更多模態醫學文件的智能解讀和交互問答。「大醫」在兩項行業權威評測——2023年職業藥劑師考試大模型評測、中文醫療大語言模型開放評測平台MedBench中,實現綜合評分排名第二,性能逼近GPT-4,其中職業藥劑師考試大模型評測中的兩個細分方向性能已超越GPT-4。

Slide4.PNG

2023年職業藥劑師考試大模型評測結果,「大醫」綜合評分排名第二,並在兩個細分方向上性能超越GPT-4

Picture1.png

覆蓋13個醫學場景的大醫Web端展示頁面

多模態是人工智能大模型重要的技術演進方向,日日新·商量多模態大模型(SenseChat-Vision V4)正式推出,其擁有300億參數,圖文理解能力處於全球領先水平,在權威評測基準測試集MME Benchmark上綜合得分排名首位,綜合得分達2199.5(超過GPT-4V的1926.57),已在智能駕駛、智能車艙、電力行業等多個實際場景落地應用,助力千行百業的產業升級。 

Slide1.PNG

多模態大模型權威綜合基準測試MME Benchmark可以從定位、名人識別、景點識別、OCR、數學計算等14個維度來系統綜合評測模型的能力。

 Slide2.PNG

日日新·商量圖文多模態大模型可回答交通場景中圖文內容理解等複雜任務

商湯自研的日日新-秒畫文生圖大模型(SenseMirage V4)較此前版本,參數量提升至百億量級,通過Mixture of text experts、Spatial-aware CFG等算法優化,語義理解能力與圖像質感細節表現顯著增強,可達成電影級海報生成水平。同時結合Adversarial Distillation算法,秒畫SenseMirage-Turbo加速版也正式對外發布,相較於基礎版本,可達到10倍推理加速效果。

 

Picture2.jpg

秒畫SenseMirage 4.0全新升級,電影級圖片一鍵生成

 

率先支持不同模態工具調用的Function call & Assistants API 版本來了,大模型時代的專屬開發助手

大模型的能力前沿且豐富,為讓更多開發人員及相關行業更便捷、高效地用好大模型, 商湯推出日日新·商量大語言模型 Function call & Assistants API 版本

日日新·商量大語言模型 Function call & Assistants API 版本為開發人員提供一個靈活、高度可定制的工具調用框架,提供了聯網搜索,代碼解釋,圖文問答,文生圖等多種工具調用,支持商湯日日新大模型體系,賦能多行業場景。 

與其他同類產品相比,日日新·商量大語言模型Function call & Assistants API 版本率先支持不同模態的工具調用,能夠支持圖文結合的多模態交互和數據分析代碼執行結果的直觀呈現,從而解決更加複雜的問題,讓各種應用程序中集成AI功能變得更加簡單和高效。

assistants api demo.gif

通過日日新商量大語言模型 Function call &Assistants API,輕鬆調用內置工具實現多模態交互(注:展示效果有加速處理)

創新場景應用加速落地,商湯「日日新」大模型體系持續賦能多產業升級

大模型的出現帶來了人機交互範式的巨大轉換,依託商湯「日日新Sensenova」能力的快速迭代,小浣熊家族再添新成員——數據分析工具 「辦公小浣熊」,重塑大模型時代的應用產品形態。

辦公小浣熊是一款無需編程或複雜操作即可使用的數據分析工具。通過自然語言輸入,辦公小浣熊結合商湯大模型體系的意圖識別、邏輯理解、代碼生成能力,自動將數據轉化為有意義的分析結果和可視化圖表。得益於商湯大模型體系的強大中文理解能力,該產品更適應中國的數據分析需求。

Picture5.png

辦公小浣熊演示頁面:輸入表格,輕鬆獲取分析報告。體驗入口:https://raccoon.sensetime.com/

產品形態的出現是大模型技術落地應用的嘗試之一,自去年4月10日商湯「日日新SenseNova」問世以來,企業用戶超過3000家,覆蓋行業包括互聯網、遊戲、文旅、教育、醫療健康、金融和編程等。

商湯始終推動降低大模型使用門檻,拓展人工智能落地場景,讓大模型真正在行業里用起來,未來將持續推進「日日新SenseNova」大模型體系建設,實現創新場景應用,不斷推動大模型前置化,讓更多智能走向更多場景、更多行業,攜手行業生態邁向AGI時代。