申请试用
登录
新闻中心

商汤科技杨帆:携手华为,与昇腾共建大模型创新生态

2024-07-08

2024世界人工智能大会(WAIC 2024)期间,昇腾人工智能产业高峰论坛2024成功举办,聚焦大模型推理和客户伙伴优秀实践,探索加速大模型创新与应用落地之路。


商汤科技联合创始人、大装置事业群总裁杨帆受邀出席并发表主题演讲《生态互联 引领大模型时代创新浪潮》,分享了商汤日日新大模型体系基于昇腾AI基础软硬件平台的全栈技术能力原生开发实践,引领大模型时代创新浪潮。


杨帆.jpg

论坛还举行了2024年度昇腾MVP聘请仪式,商汤科技联合创始人、大装置事业群副总裁陈宇恒被聘请为“昇腾MVP”。昇腾MVP是在人工智能领域有重要影响力的产学研领军人物,也是昇腾AI重大技术突破、生态繁荣发展、产业影响力提升的核心推动力量。


宇恒MVP.jpg


此外,商汤还获颁“最佳昇腾原生开发伙伴奖”,以及昇腾“领先级应用软件伙伴奖”,双方将持续深入合作,共创AI产业生态。


昇腾奖.jpg


原生开发作为加速AI创新的重要引擎,正逐渐成为行业焦点。商汤科技大模型研究总监龚睿昊受邀出席“昇腾AI伙伴原生开发成果发布”,商汤大装置将与合作伙伴一起,共同推动技术创新与产业融合发展。


商汤科技Copilot产品负责人贾安亚受邀出席“昇腾大模型推理解决方案正式发布暨五大场景优秀实践发布”,在五大场景之一代码辅助场景中,基于商汤大语言模型的软件智能研发助手“代码小浣熊”可帮助开发者提升编程效率超50%。


值得一提的是,在WAIC 2024商汤人工智能论坛上,举办了昇腾原生模型合作签约仪式,商汤科技与华为技术有限公司签署合作协议,推动大模型的原生开发迈向新的台阶。

商汤论坛签约.jpg

商汤科技联合创始人、大装置事业群总裁杨帆,华为昇腾业务副总裁史沛代表双方签约,商汤科技董事长兼CEO徐立,华为上海代表处代表郭奕昱见证签约

AI发展需要解决

生产成本和生产门槛两大问题


随着通用性和泛化性的不断提升,AGI技术在快速发展的同时,也在驱动整个产业格局的变革,而人工智能基础设施将逐渐成为一种独立的商业形态或服务能力。


杨帆指出,AGI技术持续发展需要解决两大问题:一方面是持续降低AI的生产成本,另一方面是持续降低AI的生产门槛。随着AI三大要素“算力、算法、数据”基础设施化的持续迭代,让更多人能够接触AI、使用AI,并以更低的成本服务产业、提高效率。


凭借对AI基础设施发展趋势的前瞻判断,商汤科技早在2019年便立项建设商业化的智算中心——商汤临港智算中心(AIDC)。


它不仅是一个算力集群,还沉淀了商汤的算法能力、工具能力和数据服务能力,形成了一整套端到端的服务支撑体系,旨在解决人工智能成本过高、门槛过高的问题,并持续优化效率。


PPT jietu.png


依托大装置

实现大模型的高效研发和产业应用


基于商汤大装置,商汤形成了独有的大模型研发体系,实现了“日日新”大模型的高效迭代。

在本届WAIC期间,商汤发布了全新升级的大模型“日日新5.5”, 综合性能较两个月前的「日日新 5.0」提升30%,在数理逻辑、英文、指令跟随等方面能力增强明显。此外,商汤还率先推出国内首个“所见即所得”模型「日日新 5o」,交互效果和多项核心指标实现对标GPT-4o。


1.png


目前,商汤“日日新”大模型体系已经在编程、医疗、金融、消费、端侧领域等大量应用场景和垂直行业中发挥实际价值,加速生成式AI向产业落地全面跃迁:


  • 在编程领域,通过大模型能力提供智能代码补全等功能,可以显著提升程序员的日常工作效率;

  • 在医疗领域,从诊前的预问诊,到健康咨询再到诊后随访,大模型的赋能可以极大改善患者就医全流程的体验。

  • 在金融领域,商汤已在多模态、多场景与银行、保险、券商和资管客户展开合作,提升银行生产体系到客户服务体系的效率和质量。

  • 在消费领域,商汤也与多家国内头部厂商合作,将大模型能力转化为场景化服务,例如通过Copilot帮助用户进行表格生成、数据分析、文案写作,提升个人生产力。


而要让每个人都能用上AI大模型,就必须让更多终端都能接入大模型。此次商汤推出的全面升级的端侧模型「日日新 5.5 Lite」,相比4月5.0版模型精度提升10%,推理效率提升15%,首包延迟降低40%,同时单台设备成本低至9.9元/每年,让大模型惠及每一个人。


携手华为

与昇腾共建开放、共享的大模型创新生态



从基础设施的构建,到大模型的突破,再到应用的繁荣,都离不开上下游生态的紧密协同。


在过去一年多时间里,商汤与昇腾、昇思团队进行了紧密的合作,共同构建下一代大模型底座和大模型训练新生态。


例如,商汤能够在超过三千卡的集群上,跑出行业领先的算力利用率,从而能够以性能更高、效率更高的集群能力服务下游企业。


此前,商汤大装置AI云、日日新·商量大语言模型、商汤医疗大模型“大医”均通过了与Atlas系列服务器的相互兼容性测试,能够为客户提供更为安全、高效、可靠的人工智能全栈解决方案和应用体验。


2.png

杨帆表示,“商汤的平台、算法以及行业场景的软件能力与昇腾的硬件、底层基础软件能力的深度整合,将为未来人工智能服务各个行业和产业提供更大的价值和更多样化的解决方案。”


未来,商汤还将继续深化与华为的合作,打造出更加高效、低成本、低门槛的人工智能基础设施,更好地服务更多行业、更多场景,给个人消费者和企业带来更多更好的智能化服务,推动中国人工智能技术和产业的持续发展。


商汤也期待能够与更多合作伙伴,共同构建开放、共享的大模型创新生态。