申請試用
登錄
新聞中心

商湯發佈業內首個「雲端邊」全棧大模型產品矩陣,升級「日日新 SenseNova 5.0」全面對標 GPT-4 Turbo

2024-04-25

上海,2024 年 4 月 23 日 ─ 商湯科技今日於其上海人工智能計算中心 (AIDC) 舉辦「商湯技術交流日」,發佈行業首個「雲、端、邊」全棧大模型產品矩陣,以滿足不同規模場景的應用需求。活動上,商湯同時發佈升級的「日日新 SenseNova 5.0」大模型體系,其綜合能力全面對標 GPT-4 Turbo,加速生成式 AI 向產業落地的全面躍遷,實現大模型按需所取。


在人工智能發展的最基本法則——尺度定律(Scaling Law)的準則下,商湯持續尋求最有數據配比並建立數據質量評價體系,推動自身大模型研發的同時,也為行業夥伴提供大模型訓練、微調、部署各類生成式 AI 的能力及服務。


商湯科技董事長兼 CEO 徐立博士表示:「商湯在尺度定律的指導下,會持續探索大模型能力的 KRE 三層架構(知識、推理、執行),不斷突破大模型能力邊界。」


f6fb1eb6-c86f-4766-a49e-ce35f458ed26(1).jpg

商湯科技董事長兼 CEO 徐立博士在技術交流日發表演說


「日日新 SenseNova5.0」性能對標 GPT-4 Turbo:文理雙修能力大幅提升,新增多模態交互 


自去年 4 月首次發佈,商湯「日日新 SenseNova」大模型體系已正式推出第五代版本。全新的 「日日新 SenseNova 5.0」(以下簡稱:日日新 5.0)基於超過 10TB tokens 訓練,覆蓋大量合 成數據,並採用混合專家架構,推理時上下文窗口可以有效到達 200K 左右。


YCY07815-opq805676521.jpg

商湯科技發佈「日日新 SenseNova 5.0」


本次更新主要增強了知識、數學、推理及代碼能力,全面對標 GPT-4 Turbo,主流客觀評測上達到或超越 GPT-4 Turbo。

    • 在文科能力方面,「日日新 5.0」的創意寫作能力、推理能力以及總結能力均大幅提升,相同的中文知識輸入後,可以獲得更好的理解總結及問答,為教育、內容產業等垂直應用場景提供有力輔助。

    • 在理科能力方面,「日日新 5.0」數理能力、代碼能力及推理能力達到業內領先水平,為金融、數據分析等場景落地提供堅實基礎。


此外,本次「日日新 5.0」另一大核心指標就是多模態能力。商湯多模態大模型的圖文感知能力達到全球領先水平,在多模態大模型權威綜合基準測試 MMBench 中綜合得分排名首位,在多個知名多模態榜單 MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU 取得領先成績。


在應用產品層面,「日日新 5.0」亦實現了更卓越的多模態能力。它支持高清長圖的解析和理解,以及文生圖交互式生成,還可以實現複雜的跨文檔知識抽取及總結問答展示,亦具備豐富的多模態交互能力。


率先完成「雲端邊」全棧佈局:端側模型位列行業首位,邊側推出企業級應用一體機


商湯科技推出業內首個「雲、端、邊」全棧大模型產品矩陣,其中包括應用於終端設備的「商湯端側大模型」,以及面向金融、代碼、醫療、政務等多個領域的邊緣產品「商湯企業級大模型一體機」


商湯還推出端雲協同解決方案,可以通過智能化判斷協同發揮端雲各自優勢,需要聯網搜索或處理複雜場景時分流至雲端處理,部分場景端側處理佔比超過 80%,從而顯著降低推理成本。


商湯日日新·端側大語言模型的推理速度達到了業內最快,可在中端平台實現每秒 18.3 字的平均生成速度,旗艦平台更是達到了每秒 78.3 字。擴散模型同樣可在端側實現業內最快的推理速度,端側LDM-AI擴圖技術在某主流平台上,推理速度快於1.5秒,比友商雲端app快10倍,支持輸出 1200 萬像素及以上的高清圖片,支持在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。商湯亦於今日正式發佈端側業務 SDK。


YCY07861-opq805754674.jpg

商湯端側 LDM-AI 擴圖技術


對於金融、代碼、醫療、政務等重點行業邊緣側日益增長的 AI 需求,商湯正式推出企業級大模型一體機。它可同時支持企業級千億模型加速和知識檢索硬件加速,實現本地化部署,即買 即用,降低企業應用大模型的門檻。相比行業同類產品,推理成本節約 80%,檢索大大加速, CPU 工作負載 50%。


FG__9138-opq805700704.jpg

商湯推出小浣熊代碼大模型一體機


聯合生態夥伴創新 AI 2.0 時代產品應用,打造新質生產力


本次活動現場,商湯還邀請到金山辦公、海通證券、小米、閱文集團等多位生態夥伴嘉賓,共同探討和交流大模型技術在辦公、金融、出行等不同領域的應用及前景。


• 在辦公領域,自 2023 年起,商湯與金山辦公達成深度合作,基於「日日新」大模型的卓越代碼生成及工具調用能力,助力 WPS 365 打造更高效釋放場景能力的辦公新質生產力平台,為企業構建專屬的「企業大腦」。金山辦公首席執行官章慶元表示:「在辦公應用場景內,商湯大模型的表現十分出色,能夠幫助我們的用戶解決辦公中的複雜問題,提升效率。」


• 在金融領域,海通證券與商湯科技聯合發佈金融行業多模態全棧式大模型,雙方在智能客服、合規風控、代碼輔助、展業辦公助手等領域助推業務落地,並共研智能投顧、輿情監控等行業前沿場景,打通證券行業大模型落地的全棧式能力。海通證券副總經理兼首席信息官毛宇星指出:「通過與商湯合作,我們利用大模型技術實現了海通證券數智化轉型,未來,我們將結合全棧式 AI 能力進行業務流程、交互變革與數智化業務系統重構。」


• 在個人出行場景,近期火爆市場的小米汽車 SU7,小米小愛同學為車主提供智能化交互體驗,當中也有集合應用了商湯的大模型技術,有基於商湯端雲大模型解決方案。


小米集團小愛總經理王剛在與商湯科技聯合創始人、首席科學家王曉剛對話時表示:「商湯的雲端邊全棧組合,可以很好的賦能和適配小米物聯網生態。我們希望與商湯共同為我們的用戶打造更具智能化的產品體驗。」


此外,商湯還與華為昇騰原生發佈行業大模型,共同打造為金融、醫療、政務、代碼等行業而設的大模型產業生態。在自身應用方面,商湯「日日新 SenseNova 5.0」在SenseMirage 秒畫、SenseAvatar 如影、SenseThing 格物、SenseSpace 瓊宇、SenseChat - DaYi 大醫、Raccoon 小浣熊家族等產品均有重要更新。


「文生視頻」已在路上,商湯科技堅定邁向 AGI 時代


在本次技術交流日最後環節,徐立博士還帶來了三段由大模型生成的視頻,並強調文生視頻平台對於人物、動作和場景的可控性。


YCY08084-opq805762079.jpg

商湯即將推出文生視頻生成平台


商湯科技在文生視頻平台方面也取得了技術突破,未來,通過輸入一段文字或一個完整的描述,就可以生成一段視頻,而且人物的服飾、髮型、場景都可以根據預先設定,保持視頻內容的連貫性和一致性。


通過商湯打造的智能算力中心,可以不斷賦能於大模型的訓練,目前,日日新大模型體系在自然語言處理、視頻生成、和深度學習優化等多個方面取得創新。


秉承創立之初「堅持原創,讓 AI 引領人類進步」的目標和願景,商湯科技的大模型技術和產品已在醫療、教育、法律、工業等各行各業進行實踐應用。如大模型以「日日新」為名,商湯一直堅定朝向通用人工智能的目標前行,突破數據與算力的限制,引領大模型的創新與落地。