申请试用
登录
核心技术
以原创技术体系为根基,SenseCore商汤AI大装置为核心基座,布局多领域、多方向前沿研究,
快速打通AI在各个垂直场景中的应用,向行业赋能。

观点 | 商汤科技研究院院长王晓刚:长远布局AI,不急于爆款

2018-08-08

日前,商汤科技联合创始人、研究院院长王晓刚接受了腾讯《一线》的采访,详细解读了商汤科技2018年在人工智能手机行业所取得的成绩和下半年最新规划:第一季度推出SenseAR平台,第二季度在小米8探索版上推出3D人脸解锁,第三季度推出人脸3D重建和3D虚化,第四季度还会有新的尖端技术出来。详尽内容请阅读以下文章。 


image.png


6月初OPPO在巴黎发布的Find X是商汤科技与OPPO多年合作的最新进展之一,在Find X上运用人脸3D重建技术,实现“3D个性美颜”。在OPPO R9手机上,商汤已经提供了单目虚化功能,用一个摄像头即可把人从背景上分割出来,而无需两个摄像头。接着,在R11上,继续演化成为双目虚化。


商汤最早实现在人脸捕捉106个关键点,后来形成了业内标准。接着,随着用户有美妆要求,商汤推出240点,能够更精细捕捉人的细节。因为客户OPPO要做智能美颜,根据美颜的要求,商汤又推出一套新的关键点。


这些都是人工智能给手机行业带来的好处。


   做“黑羊”,不急于爆款


手机厂商之间硬件同质化趋势越来越严重之后,软件算法成为差异化比拼之处。在王晓刚看来,哪个人工智能公司能把算法的价值体现出来,才能争取到主动权。“否则你不管跟硬件怎么结合,都会存在问题。”


他注意到一些软件算法为主的人工智能公司,有从算法开始,向固件、硬件拓展的趋势。在中国,做算法的往往受制于客户对于商业模式的认可。在大多数人眼中,做算法、卖软件,本身不能像做硬件、卖硬件那样理直气壮。硬件实物摆在面前,总是比虚无的一行行代码更值得付钱。


不过,王晓刚保持着一种克制,和对商业模式诱惑时的冷静,“不要以为把算法放到硬件里面就能体现出额外的价值,手机厂商对产业链每一部分成本都非常清楚。”他更主张专业化分工,各司其职。


整体上,王晓刚所领导的商汤科技研究院希望将眼光放得更长远,而不是某一个AI功能。“整个AI提供的舞台和天地非常广泛,根本没有必要纠结在其中一个功能点上。”除了FaceID,商汤还有3D的人脸重建、人体重建、场景重建——“我不想把这些描绘成占领一个一个地盘,因为一个单点技术很难决定一个公司命运或者走向。”


按照这种思路,商汤科技进行多方面探索,有些看起来温吞吞,不那么狼性。奇怪的是,商汤核心灵魂汤晓鸥对于商汤理念提出过一个黑羊文化。“羊造福人类,商汤也一样,造福百业。羊有一个问题,趋同,导致群羊效应。商汤不做普通羊,要做黑羊,跟别人不一样。”


人工智能基础层面很核心的芯片技术掌握在美国手里的现实,要求中国公司要注重长期的技术积累,而不是非常急功近利地去找爆款级应用。研发、应用正确的姿势应该是在一些核心技术上需要有耐心,做比较深厚积累。当爆款或者应用出现时,顺势推出。


小米8透明探索版是商汤AI技术另一个落地项目。它采用的商汤3D结构光人脸识别技术,应用了与iPhone X不同的结构光方案,能够创建带有面部深度信息的人脸模型,实现更优的解锁速度、识别精准度及安全性。


商汤科技的这项3D结构光人脸识别技术,通过投射33000个编码点阵,创建毫米级3D面部模型,并基于红外人脸图像支持进行特征提取。在此基础上,经过大量样本数据累积以及攻击测试,其能够达到百万分之一级别精度的安全识别和活体检测,为刷脸支付等高安全要求场景提供更加完善的安全保障。


在Find X上,商汤原创的人脸3D重建技术与3D虚化技术在业内首次落地。这项算法,透过3D编码结构光形成的点云信息取得深度,本地操作无需连网,即可完成建模流程的复杂算法运算,能够更快速地呈现出真实3D人脸模型。


与小米、OPPO合作之后,商汤接着又与华为合作,推出华为nova3。该款产品新加入了3D Qmoji功能,使用它,可以将拍照变成表情包。在相机模式下,3D Qmoji通过人脸关键点点位捕捉人物表情信息,通过3D拟合与表情分解,渲染出卡通形象的表情变化,驱动卡通形象完成相应的表情动画。


在3D Qmoji模式下,使用者只需要做出甩头动作,moji模型就会根据nova3的人脸识别功能,自动落在被识别的另一张脸上。


   为什么高通、本田选择与商汤合作


商汤创始团队最早源自香港中文大学实验室,已经有20年历史。“汤晓鸥老师建立团队在20年前,研究积累了20年,其他人想复制商汤模式很难。”王晓刚说。


搭建研究团队,建立研究平台,在实际中真正接触到了大规模、产业化的应用需求。比如,商汤合作的一个城市项目里,布下了10万路摄像头进行人脸识别、人的轨迹追踪。“首先要有系统平台,我们在这个庞大平台上开始做这个研究。”


正是此类优势,吸引了高通、本田等世界级公司选择与商汤科技合作。高通找到商汤,因为他们知道未来的AI芯片重要性。设计AI芯片,支持深度学习神经网络,需要找到合作伙伴。


而商汤正是最早而且有大量人工智能深度学习技术落地在手机上。“我们真正知道哪些应用,会在什么时候落地到手机上,应用到高通的芯片上,我们在应用过程中遇到了哪些问题,将来芯片怎么设计会更合理,这些是高通想要的。”王晓刚说。同时,高通还是商汤的战略投资人,在B+轮进入。


与高通的合作不是偶然,商汤自动驾驶与本田公司战略合作,“本田2016年到中国找战略合作伙伴,也看了很多,最终找到了商汤,那时候商汤并没有太多的自动驾驶方面的成果。它来到我们这边,看到首先我们有自主的AI平台,用的并不是开源的东西。我们用的都是自主开发的深度学习引擎。”王晓刚介绍。


2016年时,商汤已经能够训练出超过1000层的神经网络。有很强大的平台在后面做支撑。1000层网络意味着什么呢?


王晓刚说,深度越深,网络学习能力越强,学习能力随着层数增加呈指数增长。很深的网络非常难训练的,一般平台无法支撑。2016年,商汤用这样的网络在ImageNet拿了三项冠军。