近日,弗若斯特沙利文(Frost & Sullivan,简称“沙利文”)发布《AI 大模型市场研究报告(2023)——迈向通用人工智能,大模型拉开新时代序幕》。报告显示,根据产品技术、战略愿景、生态开放构建的大模型竞争力评价模型,商汤科技综合竞争力第一。
图:中国大模型厂商综合竞争力表现(来源:沙利文)
报告认为,伴随基于大模型发展的各类应用的爆发,尤其是生成式 AI,促使大模型带来的价值进一步升级到人类生产力工具的颠覆式革新,逐渐拉开了通用人工智能(AGI)的发展序幕。
在通往AGI时代的旅程上,大模型和人类反馈的强化学习(RLHF)的结合,不仅重构了AI开发范式,未来软件80% 的价值将由 AI 大模型提供,剩余 20% 会由提示工程和传统业务开发组成,开发者的生产力将得到极大释放;与此同时,AI的发展也将由之前单向发展的数据飞轮升级到不断迭代进化的智慧飞轮,更高效的解决海量的开放式任务。
报告指出,中国大模型厂商的成功因素主要包括:全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性4个方面,其中全栈大模型训练与研发能力还包括数据管理经验,AI基础设施建设与运营,以及大模型系统和算法设计3个部分。这些成功因素分别体现着大模型厂商的产品技术能力、战略愿景能力、生态开放能力三个维度。基于这三个维度,沙利文制定了超过70个评估指标,对大模型厂商进行了全面的能力评估。
商汤凭借前瞻性的SenseCore商汤AI大装置的建设布局,以及领先发布的SenseNova日日新大模型体系,在三个维度均拿到了领先得分,其中产品技术和生态开放两个维度拿到最高分,进而保证了获得综合竞争力第一的结果。
商汤构建了从AI基础设施到大模型研发的全栈能力
历时五年,商汤建设了 SenseCore商汤AI 大装置,成为国内稀缺的大模型建设基础设施。SenseCore商汤AI 大装置包括 AI 原生基础设施、大模型生产平台、模型算法服务以及辐射行业应用。
AI原生基础设施能够实现产品级千卡支持,且千卡满载率下GPU利用率高达97.3%,极大的提高了大模型的训练效能。同时,在开发平台提供整套大模型工具链,涵盖数据、训练、推理的完整工具,实现大模型微调生产、自动化模型部署、一键推理服务,进而加速大模型研发。当前,商汤人工智能计算中心(AIDC) 提供了超过5000P算力,当前算力可支持 20 个千亿参数超大模型同时训练。
依托8年AI数据标注及10PB级数据管理经验,商汤研发主动学习半自动标注模式,集成积累的20+种成熟业务模型及100+种预训练模型,覆盖检测、分类、分割、跟踪、点云、OCR等场景的智能标注,显著提升数据标注效率,提高大模型的训练效率和缩减迭代周期。
基于大装置,商汤拥有了大模型生产的核心平台,不仅对内支持打造了日日新大模型体系,同时具备对外提供大模型训练赋能的服务,包括从工程开发到生产部署,截止目前,已经服务 8 家大型客户进行大模型训练。
图:SenseCore商汤大装置支持商汤日日新SenseNova大模型体系,同时满足客户自训大模型
商汤日日新SenseNova大模型体系:
l 商量SenseChat:千亿级参数的自然语言处理模型,充分考虑了中文语境,能够更好地理解和处理中文文本,尤其拥有出色的多轮对话和超长文本的理解能力。
l 秒画SenseMirage:文生图创作平台,展现了光影真实、细节丰富、风格多变的文生图能力,可支持6K高清图生成;客户还可根据自身需求训练生成模型。
l 如影SenseAvatar:AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
l 琼宇SenseSpace和格物SenseThings:3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
在大模型研发上,商汤构建了从底层训练系统到算法设计优化的体系化研发能力,从模型设计、训练、优化、再到模型服务如自动化标注系统,构建了研发到落地应用的成熟产业链条。在算法设计方面,应用Uni-Perceiver将不同模态数据编码到统一表示空间,统一不同任务范式,从而以相同架构和共享的模型参数同时处理各种模态和任务。通过采用大模型结构设计与大Batch训练优化算法,使得商汤的文生图大模型(秒画 SenseMirage)具备更优的文本理解泛化性、图像生成风格广度以及图像高质量生成细节。
图:商汤大模型的体系化研发能力
商汤拥有丰富的大模型应用实践
在大模型浪潮掀起前,商汤就已有自己的预训练大模型,并基于深耕的业务场景持续探索大模型的商业化应用,包括智慧城市和自动驾驶等应用场景。商汤超大模型已经覆盖核心公司业务,超过20个场景落地大模型交付,5个项目生产Serving交付。
在2023上海车展上,与商汤“日日新SenseNova”大模型体系深度融合的绝影未来展示舱升级亮相。语言大模型“商汤商量SenseChat”以及AIGC文生图平台“商汤秒画SenseMirage”首次“上车”,重构人车交互方式。
商汤开放了日日新大模型体系的API,对外输出图片生成、自然语言生成、以及视觉通用感知任务&标注能力,支持企业客户测试。截止目前,已经有500多家企业客户通过了日日新大模型体系中的大语言模型“商汤商量SenseChat”的API申请,开始应用和体验其测试和服务,覆盖汽车、电力、能源、教育等众多垂直领域。
商汤秉承生态开放性打造“技术-商业”闭环。
大模型的开放性高低程度决定了大模型厂商能否成功打造“技术-商业”闭环。一方面,大模型的全面开源和基础设施能力的开放能够孵化更强的技术产品,加速商业化落地。另一方面,大模型生态圈的建立能够提高产品兼容性,并以数据反哺模型加强迭代。商汤开源多模态多任务大模型“书生 2.5”,具有 30 亿参数,是全球开源模型中 ImageNet准确度最高、规模最大的,同时也是物体检测标杆数据集 COCO 中唯一超过 65.0 mAP 的开源大模型。商汤还构建了包括OpenMMLab、OpenDILab、OpenXRLab、OpenPPL 在内的开源算法框架体系,与业界共享创新成果。
凭借具有前瞻性的“大装置+大模型”的战略布局,商汤不仅能够授人以鱼,还能够授人以渔,不仅能提供大模型的应用服务给到企业客户,还能为企业客户训练基于自身所处行业和业务场景特征的行业大模型。
在未来,商汤SenseNova日日新大模型体系将会不断迭代,SenseCore大装置也将会持续建设完善,继续在人工智能的关键领域深入挖掘和探索,构建通用人工智能 (AGI) 核心能力。
点击获取完整报告:AI大模型市场研究报告2023.pdf
-
2023-03-28
-
2023-03-27