作者/
刘亮 商汤智能产业研究院战略研究主任
近日,全球知名研究机构弗若斯特沙利文(Frost & Sullivan,简称沙利文)联合头豹研究院发布《2022年中国数字人市场观测报告-里程碑》。报告显示,商汤科技数字人已全面进入“成熟阶段”成为市场领导者,并在十个评估指标中获得六项最高分,厂商整体竞争力排名第一。
图:中国数字人市场综合竞争表现——Lead Flow(里程碑)
该报告将数字人厂商的能力划分为“起步、探索、发展、成熟”4个阶段,并用圆圈大小反映各厂商在所处阶段的竞争能力和市场地位强弱。基于中国数字人产业生态图谱,只有七家厂商入围了最后的数字人里程碑综合竞争力评估环节,仅有商汤完全进入“成熟阶段”成为市场绝对领导者,并在十大评估指标中得到六个第一,全面领先所有入评厂商。
报告认为,依托于交互媒介的进步,数字人相关技术将不断向沉浸感、交互性、开放性强的方向发展,而推动数字人各工序技术革新的关键突破口则是人工智能技术的发展。
商汤智能产业研究院联合增强现实核心技术产业联盟(CARA)共同发布的《AI数字人白皮书》(回复“数字人白皮书”获取报告)中也提出类似观点,白皮书将数字人的发展历程划分为L1-L5五个等级,把L4级别及以上的数字人统称为“AI数字人”,并指出只有达到L4级别及以上的数字人才能真正走进千行百业,推动生产力变革。
可见,AI技术的发展在数字人的演进中发挥着至关重要的作用。
作为AI数字人技术的领导者,商汤以原创的多模态交互、深度学习和全栈式的AIGC(AI Generated Content)技术,构建了智能化生成、智能化驱动和智能化交互三大引擎,打造出“一站式”AI数字人生产流水线,力求向业界提供更高效、更低成本企业级AI数字人。
图:商汤AIGC“一站式”数字人生产流水线
沙利文在报告中指出,商汤科技在数字人领域具有三大明显优势:
1、 AI 技术“双维度”研发投入
围绕 “拟人化”和“自动化”两大维度,对数字人相关的人工智能技术和算法进行投入和研发。在计算机视觉方面,视觉相关的算法模型累计超过30,000个,覆盖视觉信号的分析理解,以及实现数字内容的生成,并研发建成了世界上最大的计算机视觉基模型,参数高达300 亿。在语音语义理解方面,自研并具备包括语音识别(ASR)、语义理解(NLP/ 知识图谱)、语音合成 (TTS)以及语音动画合成(STA)等多项技术能力。
2、 制作运营“一体化”
商汤通过运营管理平台打通技术到应用的“最后一公里”,为 AI 数字人行业应用提供终端管理、数据管理和分析、数据训练、资源管理等主要服务,上接AIGC 生产平台形成制作运营“一体化”模式,面向行业进行“全链路”赋能。
3、 全行业方案覆盖
商汤面向泛娱乐、商业零售、金融服务、文博文旅、政务服务等全行业提供企业级AI 数字人解决方案,通过跨屏、跨系统支持,不仅可以兼容不同展现形式,还覆盖超过200款手机、平板电脑、AR/VR眼镜、智慧大屏等多种终端设备上线AI 数字人应用。
图:商汤数字人产品架构和场景覆盖
“数字人是图灵测试中对AI定义的终极形态,也是人机交互最自然的模式。商汤科技希望通过自身强大而综合的AI能力,以及成熟丰富的2B服务体系,为各行各业提供完整的数字人全链条解决方案。”
——栾青,商汤科技数字空间事业群数字文娱事业部总经理
目前,已经有大量的企业客户利用商汤科技提供的数字人来赋能自身业务的转型与创新。既包括零售行业的永旺超市,也包括金融行业的宁波银行上海分行、浙江农业银行、兴业银行、工商银行等等。举例来说,宁波银行上海分行利用商汤数字人“小宁”代替真人大堂经理接待客户,回答各类业务问题,并在后台汇总高频需求并进行智能分析,辅助预测业务方向,为网点客户提供更优质的服务。
图:商汤数字人重要客户历程
未来,商汤将持续发挥其在计算机视觉、深度学习等AI技术方面的优势,夯实AI数字人的生产力底座,在产业生态的基础层、平台层、价值层和交互层提供更好的资源支持,推进数字人产业的整体发展演进。
-
2023-04-26
-
2023-03-28
-
2023-03-27