申请试用
登录
最新动态
面向政府机构、企业、智库以及行业协会等组织机构,商汤智能产业研究院以研究和赋能为核心,建设开放、合作的产业生态。
首页 > 商汤生态 > 最新动态
认知即世界: 从“数字世界”到“智能世界”
2022-12-28

《甦对谈》第一期完成开题,以“2022经济新变局,会催生哪些商业新物种”为主题,梳理新物种的生存关键词 —— 生命力、复原力、生态位。

 

《甦对谈》第二期,聚焦“数字世界的产业应用”。邀请新物种研究院专家组成员、DCCI互联网数据中心创始人胡延平与商汤智能产业研究院创始院长田丰,以“走出元宇宙认知偏差,理解正在进入的数字世界”为主题,从争议颇多的“元宇宙”话题开始,正本清源、脱虚向实,深入探讨人类认知的三个范式,我们所身处的四个世界、算力所做的四个方面的努力,以及商汤科技跨产业的数字世界创新案例,试图从中获得启发,洞察在可预见的未来,各个行业的升维机会。

 

面对新周期

科技动能与经济换轨

 

胡延平:今天参观体验真是非同寻常,很有趣。我觉得还是有很多具体场景让大家对AI更有感觉,而且这些场景不只是做出来供观赏,而是很多行业企业客户都在实际使用。

 

刚才我们已经进到了数字世界,我今天也是带了很多问题,关于AI、关于前端硬件软件技术、算力的问题等等,但更感兴趣还是这样的场景和应用的关系,尤其是AI和今天经济社会之间的关系。

 

最近一段时间,我们都有一种压力,看朋友圈、微信群或者是线下很多朋友交流,都在讲现在的疫情和经济状况,2022年对于每一个人都是充满高度不确定性的一年,有很多变化。田院长您对2022年的经济变化怎么看?你们的感知和传统行业、其他各行各业企业有什么不一样?

 

田丰:经济和科技像DNA的双螺旋。国务院印发的《“十四五”数字经济发展规划》中提出:“数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素”,而以人工智能为代表的新一代信息技术,正在释放全中国海量丰富的数据红利,拓展经济发展新空间。人工智能正作为关键性的新型信息基础设施,被视为拉动数字经济发展的新动能;其产业化进程已逐步从AI技术与各行业典型应用场景融合赋能阶段向效率化、工业化生产的成熟阶段演进。

 

胡延平:听得出来咱们不仅仅关注机会,而是从信息技术、智能、网络、传感这个角度,能够为经济做哪些建设性的事。比起担忧、或者抱怨,更关注我们能够做什么,如何让企业更有活力、创新力、竞争力。

 

最基础的传感,在我理解,传感就是让企业如何有感知力,能够基于感知力建立判断力,这样在市场里才能更敏捷,有更快的速度、准确的方向,还能跟消费者、跟用户之间形成息息相关、紧密互动的关系。

 

2022年整个经济最大的变量,在我们看来,第一是资本和金融体系的扰动;第二是能源市场的扰动;第三是疫情;第四是地缘政治;存在不确定性。除此之外,还有一个巨大变量,这个变量更多是化危为机、建设性的,就是科技、智能、技术、网络,这是能够让每个企业强身健体、增强竞争力的变量。

 

田丰:从经济学回顾,2002年互联网泡沫破灭的时候,大家觉得非常受挑战。但是这时候元宇宙前身的公司已经诞生了,还有像互联网游戏、社交、电商、广告都是在那时候逐渐脱颖而出的,在泡沫之后有巨大的黄金机会。现在又到了经济的转型期,在整体换轨的过程,这不是自由落体而是换到一个新轨道,再卯足干劲往前冲。

 

人类认知的三个范式

空间认知的四个世界

 

胡延平:对企业来讲是蜕变,对产业来讲是转型,对于整个国家经济来讲,这是一场充满挑战的变革。这个变革的过程中,有一个很大的变量,同时也是最大的动能,就是科技。这是我们可以掌控的,可以利用的。我发现,你有一个提法是产业元宇宙,今天你们更新的提法是数字世界,这里有微妙的差别,我想它可能是对底层逻辑的深度洞察,基于深度洞察对自己方向和业态方向的准确判断。

 

之所以提这个问题,是在想我们应该如何看待新科技和传统经济之间的关系,如何看待虚和实之间的关系。是去赋能、助力实体经济,还是脱实向虚?

  

田丰:我们可以看到,人类正在经历从地球文明到太阳系文明的阶段。不管是能源、人口生产力、还是其他等自然资源,地球资源总量是固定的。人类发展必须跨过进化墙,突破能源、科技和人口等瓶颈。这背后有两条主线,一是人类认知升级,二是人类对空间认知的变换,或者说构建虚实融合的数字世界。

 

人类认知包含三种认知范式:从已知经验中归纳、推理演绎、假设猜想。第一种认知范式,比如我跟胡老师聊得多,我就了解很多经济学的知识,归纳出一些经济规律,这实际上是人类认知的归纳法。第二,胡老师教了一些公式,我可以用公式推理出一个公司的估值,这是推理演绎法。第三,人类认知中的人类猜想,某一天胡老师请我喝咖啡,瞬间我就像牛顿脑袋被苹果砸了一下,突然想到一个猜想,科学家经常有灵光一现,然后再去验证。

 

进入人工智能时代,这三种人类认知范式又变化升级出三种机器认知范式:一是经验归纳法变为大数据归纳,通过海量数据探索人类未发现的规律,比如像AlphaGo,人类的棋谱几千年的积累,但是机器学习自己下,几天内就有新棋谱出现,因为从大量棋谱练习中,可以推理出一些规律。

 

二是推理演绎法变为仿真模拟,真实模拟现实世界,依靠算力按照科学规律推演新发现,比如研究药品分子式,去看大量蛋白质空间结构,总结出规律之后,大家通过线上模拟可以快速用算力来压缩研发的时间,再用线下方式验证很多分子式的空间折叠结构,这样是推理法。

 

三是人类猜想变为机器猜想。在数据红利背景下,将产生大量的数据对撞,很有可能诞生出新的理论假设,通过实证研究、仿真推理演绎再去验证它,所以这三种认知方式都在升级。

 

再说空间,以前在城市领域发生大场景的智能化,比如人群聚集的发现和预警。但是现在,社区内部有高空抛物,电梯有电动车驶入等小场景都能在数字世界中实时感知,甚至可以预判。比如城市立交桥下有积水,可以预判未来一小时持续积水会对行人和车辆产生什么样的危害。我们把这叫做数字孪生的世界,现实世界发生什么,数字世界中同步实现什么。

 

更进一步,是数字孪生到数字原生。当人机结合到一起的智能,能够模拟出两小时以后城市交通状况,或者创造出工厂在生产过程高效率运转规则和模式,在数字世界把这些新规则应用到物理世界。这叫数字原生,用AI技术产生虚实融合的新世界。

 

此外到了智能世界,可能一开始是智能派单,后面逐渐有机器人、无人驾驶车去解决。

 

胡延平:这三个认知范式的转移非常有启发。人工智能也已经发生了新的阶段,从计算智能、感知智能,现在往认知智能方向走,智能已经不需要大量数据集才可以训练,而是自己拥有自学能力。同时,人工智能不完全是拟人或者拟脑的类脑计算,未来自己可以形成新的认知和判断方式吗?

 

现在讲情感计算或者人工智能对情绪理解,以及它本身自己如何有情绪。更深一层就是伦理,这很多时候不仅仅只是规则标准问题,不是简单用逻辑或者基本常识或者知识,这完全进到了一个新世界。

 

田丰:是的,数字世界背后AI技术作用会越来越大,因为人口老龄化在加剧。

 

胡延平:对三个范式、四个世界的深度理解,有助于我们理解和构建未来数字世界根本的规则和秩序。尤其关于范式升级和第四世界,有一个深层次的问题是,我们如何理解现实世界和数字化、虚拟化、智能之间的关系?这里有根本性原则性的差异,相当一部分人认为是扩展现实、增强现实、或是混合现实,但他们没有理解这里是有全新的东西,因为智能、因为科技,其实会产生现实世界原本没有的,包括在数字空间也原本没有的新东西。

 

在过去从来没有存在过的东西,一个新的世界是怎么样的?这也让我想起算法公平透明,未来智能是否可以做伦理道德计算,实现的话毫无疑问,它对现实世界已经具有了深度规则性。在很多时候是可以去做预判,像AI现在已经在帮我们管理交通、避免违规事故、处理交通违章,这都是非常好的场景应用,另外还有比如暴雨来了,城市积水问题,像郑州去年的暴雨事故,这样的场景大家对AI抱有期待,对于第四范式、第四世界抱有高度期待,因为能极大减少人身的意外,减少对整个经济社会的破坏,这特别值得期待。

 

我注意到商汤的发展轨迹越来越清晰在转向赋能产业、助力经济,让现实世界每一个场景因为AI更有效率,而且能够解决一些问题,推动可持续发展,让这个世界变的更好。

 

田丰:关于伦理,目前来看,实际上还是人在设定不论是法律还是伦理的规则,AI只是感知。我们还是拿下雨城市有积水来举例,一旦下起暴雨全市上万个井盖,甚至几万个井盖不大可能用人力去一个个查看。但是人力可以设置规则,软件去执行这个规则,硬件最终给一个反馈和执行的结果。

 

从这个角度讲,不论是自动驾驶还是井盖的预警和预维护,都是在遵守人类制定的规则,这是伦理方面。AI很难自己产生规则,自己产生的规则不符合人类,所以我们提出AI伦理有三个核心原则。

 

一是技术可控,技术是由人类开发并为人类服务的超级工具,工具的伦理责任应由人类承担。

 

二是可持续发展,这是最大的社会责任。其中很重要一点是人工智能的发展不仅要造福于人类,也要造福于我们的地球。

 

三是以人为本,可持续发展的主体是人,要尊重人类的基本权利,构建充满人文关怀、互相尊重的包容性AI,让技术真正造福于人。比如关注边缘人群对科技是不是能适配,关注大多数人群对新技术应用范畴,包括它的伦理风险。商汤正在这三原则基础上,不断建立相应的标准体系和实践,在需求均衡、动态中发展。

 

刚才提到四个世界,第一个是物理世界、现实世界;第二个是数字孪生世界;第三个是数字原生世界,第四个世界是AI驱动虚实融合的智能世界。

 

关于认知范式和数字世界、虚实世界、物理世界,我有一个不成熟的看法。人类对于宇宙的探索、对于自身的探索,人类观察物理世界的边界是认知边界。物理世界比我们想象要更广大,刚发现经典力学定律的时候,其实它有很大跟真实世界的鸿沟,所以才会有相对论、量子力学。

 

刘慈欣有一个观点,当人类发现一个“真理”的时候,物理世界的真相又往前延伸了很多,我们发现的永远是局部的认知。我们对物理世界不管是对宇宙边界的探知、物理底层探知永远是阶段性,或者永远部分正确、部分错误。认知即世界,世界边缘往往是我们认知边界决定的。这就是我们刚才讲三个范式和世界的关系。

 

数字经济四个变量:

新基建、新终端、新交互、新服务

 

田丰:人工智能怎么帮助产业发展?在未来十年,我们认为新一代数字经济有四个变量:

 

第一是新基建,旨在实现数字化、智能化、新旧动能转换与经济结构对称态,它正成为国家政策和各地方高质量发展的重要抓手。

 

第二新终端,包括智能车、AR眼镜等新硬件,将逐步取代智能手机进一步便捷化人们的生活。

 

第三是新交互。以前手机是触摸方式,输入数据速度是有限的,但是现在屏幕到处都有,只需要有一个云上计算单元接到屏幕上,就可以留下交互数据。交互是人机之间的一种语言,也是一种界面,更确切说人类的媒介现在是由人机交互方式决定的,刚才看用手势交互是一种方式,或者跟NPC数字人交互,语音也是一种方式。未来,用户将迎来更宽广的交互空间,形体、自然语义、手势,甚至脑电波,都会成为新的交互手段。

 

第四是新服务。虽然我们不能完全预测十年以后数字经济的新服务的形态,但不是现在的APP。比如今天有一个直播,会直接给我推荐周边的咖啡或者其他服务,这是无缝接入,而且跟空间场景相融合的主动式服务。随着全球科技革命和国内消费升级,推动服务体验的创新层出不穷。

 

简单来说,新基建要前置,然后是新终端、新交互、新服务。举一个例子,商汤的AI大装置战略,能够真正意义上降低人工智能生产要素的价格。通过使用SenseCore赋能人工智能模型生产全流程,相较于行业数周的开发时长,我们的研发及工程团队可以将其缩短至数小时。随着我们不断提升SenseCore的技术和生产能力,我们每年生产的商用模型数逐步提升,2021年底商用模型数量达34000多个,相较于2020年底13000个增长了152%。SenseCore也让我们AI研发的人效逐年提高,2021年我们的研发人员每人年均生产的商用模型数增至5.94个,相较于2020年的3.45个提高72%,相较于2019年的0.44个提升了13倍,涉及四大业务智慧城市、智慧商业、智慧生活、智能汽车。

 

胡延平:你们是不是现在已经开始用AI产生AI?

 

田丰:您说的很准确。现在人工智能在前沿领域大家探讨的是基础模型,就像用机器人生产机器人。在AI算法工厂里,有基础模型的时候,你可以自动化生产很多小模型,这些小模型针对不同的场景。

 

胡延平:这个很有意思。新物种研究院发起的《甦对谈》就关注新,甦本身是重新开始、重新复活,产生新物种。你前面讲到“四新”,新基建、新终端、新交互、新服务,是不是从生产AI的角度来讲,今天智能已经成为产生新物种的一个很重要变量,它不仅仅是赋能、助力,变的更有效率、更有竞争力,而是从根本上讲,让企业商业蜕变成为过去没有过的新物种,不仅仅是增量或者增强的概念,而是变成一个新物种。

 

这方面有一个理论叫1%的理论,从生物学的角度来讲,很多物种基因差异只有3%、5%,甚至1%。我们和香蕉基因40%多是同构的,我们和宠物的基因差异也就百分之十几。因此我在想,有差异的部分是不是使得物种出现跃迁退变的原因。忽然之间实现了物种的跨越,可能只是因为1%。那1%是什么?今天我越来越觉得至少在相当的场景里是技术、是智能。

 

一个企业不一定所有方面必须是全新的才是新物种,可能因为AI的导入使得它发生了翻天覆地的变化。这不是讲AI万能论,而是说对于新物种产生,最关键1%的变量是什么,使得它出现巨大差异变量是什么,在今天来看就是科技的部分。

 

田丰:实际上,现在云端和终端的智能将实现一体化。原来一个城市里所有摄像头都是在云端运行,因为边侧的计算能力非常有限,也没有轻量级的算法,以前AI算法很重,只能在云端跑。根据全球技术市场咨询公司ABI Research的报告,使用人工智能(AI)芯片的智能摄像头全球数量在2025年将达到3.5亿个,在智慧城市中成为常态。到2025年,超过65%的摄像头预计将至少配备一个AI芯片组。它的算法大量在前端处理,云上压力会减很轻。这些算力是什么?不是简单1+1等于2的计算,而是识别以前丢电瓶车可以找到,现在丢猫也可以找到,这些小长尾模型都会在端测进行识别,把结果传到云端。

 

所以云端更像是创新的实验室,大量数据在上面混合计算。就像自动驾驶汽车一样,有几十万辆、几百万辆的车,每天数据传上去在云端进行智能处理。而且云端很重要一点是有群体智能,不管是管理一个城市还是一个很多汽车交通,其实都是群体智能,包括红绿灯,红绿灯不是为了我家门口一个红绿灯的效率,而是区域达成最优的效率,这是人工智能另外一个变化,从单体智能变成群体智能。

 

背后还有一个变化,早期经常说人工智能分成视觉智能、语音智能和自然语言处理(NLP)等。现在已经不再是如此,一方面是交互层面是多模态的,另外它是一种通用智能。所以,通用智能是趋势,不管输入的是视频、音频、文字数据都可以处理,后面又可以通过大模型生成很多小模型适用不同的场景。坦率说,每一个城市环境不一样,智慧城市场景非常多元化,比如南方水很多,关注的是水体保护,有没有违法钓鱼,在北方关注雾霾、风沙、跟地理环境强相关治理要求。

 

所以回到根本性上来说,人类为什么要变化,或者说甦为什么有从0到1的变化,是因为环境在变化,我们必须不断适应环境,而适应最小的代价,就是通过AI定义软件去调整策略才能更好适应外边千变万化的自然环境、社会环境、包括产业环境。

 

突破算力瓶颈

AI软件加速硬件

 

胡延平:提到商汤AI大装置,它能大到什么程度?据我所知,特斯拉超级计算机Dojo不光是新发布的芯片架构,而是整个云端超算中心,这个超算中心集合了全球范围内所采集的智能汽车、计算机视觉的数据,反过来帮助它优化自动驾驶系统。

 

田丰:商汤在2022年1月份启动运营的商汤智算中心(AIDC),是SenseCore商汤AI大装置的重要算力基座。

 

如果单纯看自动驾驶这个领域,特斯拉超级计算机Dojo之后,所有自动驾驶中美欧公司开始考虑建立超算,为什么需要强大算力?因为自动驾驶不可能所有测试都在路上进行,时间耗不起。第二路上的长尾场景你怎么去复现,这很难。所以,我们需要在模拟高仿真程度的虚拟路侧去模拟很多长尾场景。比如有一只狗跑在高速公路上,怎么处理;一个小朋友出现在出入匝道,怎么处理。

 

未来数字世界是高仿真的,能够改变时间的概念。为什么?我举一个例子,谷歌在硅谷有一个办公室测试保洁机器人,它在现实中测和虚拟空间中测,现实中只有10个、20个,虚拟空间可以放1万、10万个机器人的实例。而且,只要算力足够大,可以同时测10万个场景,捡香蕉皮、捡杯盖,一天训练相当于是线下几年测试时间。同样的仿真测试,只要你的算力足够大,可以快速压缩科研实验成本。这也会应用在医药行业研发、科学研发上。

 

胡延平:的确,现在工业领域的仿真已经在实践,成本大幅降低、效率大幅提高,原来要去线下做很多真实场景测试,周期长、成本高、代价巨大、不一定效果好。尤其在跟安全有关的新医新药的研发,除了预测蛋白质的结构以外,还有可以检验新药可能有什么样的副作用,先用算力算法去模拟,再跟人体和临床试验结合。对于AI来讲,算力还是比较重要的基础。

 

田丰:对,有一个现象叫算力饥饿,所有算法就像嗷嗷待哺的孩子一样要吃算力。

 

胡延平:算力的提升是摩尔定律,AI对算力需求是要超过摩尔定律,现在算力在后面,尽管算力提高比较快,手机已经10个TOPS(1TOPS代表处理器每秒钟可进行一万亿次,10^12操作)甚至更高的算力,相当于十几年前超算的概念。

 

田丰:现在一个手机就可能完成阿波罗登月所有的计算。

 

胡延平:现在像桌面终端,笔记本或者台式机或者小型工作站,差不多20-100TOPS,像智能驾驶汽车算力是手机的10倍。

 

田丰:自动驾驶汽车领域,在L2级别高算力在100TOPS左右。英伟达有一个预测,大概三年后会变成1000TOPS,因为要保证有故障了另外一个可以备份,所以算力需求非常大,包括AR、VR眼镜等可穿戴设备对算力和算法要求很强。

 

胡延平:英特尔的人曾讲过,元宇宙所需要的算力和现实世界所能提供算力有1000倍的差异。现实还是比较骨感。

 

田丰:您说的现状非常准确。在物理极限的层面,摩尔定律已经有瓶颈,下一个阶段怎么做?现在整个产业界在做一个叫做DSA专有架构的AI推理芯片。目前用人工智能设计芯片,以前设计芯片堆叠是非常复杂的,人去设计电路,基本能够实现三层堆叠。如果做微观电路设计,或者是做宏观交通智能设计,需要消耗算力很高。但是,怎么提升算力?还是要回到AI软件加速硬件,包括英伟达等大公司都是用这种方式做。现在可以说AI定义软件,软件加速硬件,让硬件跑的更快。

 

胡延平:其实刚才你提出了非常重要的问题,对于中国大平台级企业,还是像商汤这样聚焦AI基础设施的公司,大家面临同样问题是都进入无人区了,对于算力、算法的智力架构,下一阶段往什么方向走?计算的架构或者是人工智能基础设施的架构,这是这个领域内处于生态主导地位也好、领导地位也好的企业一定要思考的问题,一定要帮助整个生态架构的问题。

 

在解决这个问题方面,我们目前看到了三种努力。一种努力是半导体工艺,7纳米、5纳米、3纳米往1纳米走,包括立体封装,再包括指令级优化等等,多元异构芯片架构,CPU、NPU、GPU放在一起,通过这样做法提高算力,包括云端的芯片。

 

第二种努力是基于通用算力需求专用计算,这方面有硬件加速也有软件加速,您刚才讲的DSA从大方向来讲还是在FPGA和ICK方向上。

 

第三种努力是如何构建整个AI大体系,用软件去定义世界、软件定义硬件、软件定义算法,用AI产生AI,还有什么全新架构和什么创新做法。

 

田丰:对,这个很有趣,芯片在专有化,但是算法在通用化。传感器是让原来的大数据显得更小,我们有更海量的数据。

 

胡延平:从个体智能到群体智能,架构的变化有可能带来生产力和能效水平的指数级提升。对于AI基础设施的架构,未来往什么方向走?

 

田丰:这是终极问题。从根本上讲,为什么算力算法和数据要不断提升?人类认知实际上对这个世界是简化认知,这个世界是极为复杂的巨大系统,人类的认知有很强的片面性,所以才需要去无限接近真实世界中的无限细节。我们数据量是海量的,如果说原来互联网时代数据量像一条河流,进入人工智能时代无限逼近真实世界,它的数据量像大海一样。我们想一想,海里水分子互相之间关系是什么?那是高度复杂的,现在人工智能出现了千亿参数级的大模型,用深度神经网络,每一层去解决不同的问题。由人工智能发现海量数据里的关系,需要做人类可解释和抽象化,数据背后代表真实世界和物理世界复杂的关系。

 

第一,在数据层面无限海量,因为仿真也有不同层面,全要素仿真如果有量子计算机能不能仿真到每一个原子,这是可以探讨的。

 

第二在于模型层面,我们认为它未来发展是轻重分离的。比如以前人工智能分为训练和推理,把人工智能当成小朋友的话,教小孩子学习叫训练,学完以后去用、干活或者是考试叫推理。原来的训练和推理受限于芯片,只能在云端进行。后来端上推理比较好,推理在端上进行,但是现在端上有隐私、有安全原因,或者像医院里有要求数据不出院,是不是可以在端侧进行训练,现在端侧的芯片已经具有可以训练小模型的承载能力,这是轻量型,可以放在手表里、眼镜、车里,可以在端侧运行。

 

云端越来越重,就是大模型。中模型就是几十亿参数级,大模型是百亿、千亿。未来将构建视频领域超大模型,甚至做融合型模型,既能处理NLP语义,又能处理语音,又能处理视觉,称为通用型的模型。所以这个在业界叫基础模型(Foundation model),这个会越来越重。

 

举个简单的例子,比如AI数字人放在银行进行智能客服,能不能平移到医院的场景里,回答各种咨询病理的问题,这就是通用性。在机器学习叫预训练或者迁移学习,越通用,生产模型成本和速度越好,性价比越高。业界有一个预测,如果达到百万量级模型数,世界的大量腰部算法就都有了。

 

商汤的AI大装置战略

 

胡延平:开源领域是不是意味着你们建立了开发者生态?各行各业以及研发人员都可以用你们的开源平台,甚至云端开放算力等等去做他们的事情。

 

田丰:商汤AI大装置SenseCore整合了我们在业内领先的AI算法能力,通过与算力层和平台层的协同,将创新的算法模型开放给企业用户及社区开发者。依托香港中文大学商汤联合实验打造的OpenMMLab开源计划,商汤科技已将250多个算法和2000多个预训练模型进行了开源,与社区开发者共同构建创新生态。商汤科技开源的算法和算法模型在GitHub上已获得超过五万颗星赞,居于亚洲首位。

 

其实全球有上千个开发者和开发者团队在为开源算法库贡献新的代码,包括中国头部互联网公司、美国头部科技公司、全球的一些名校都在用这个开源算法库。本质上来讲,真正要让模型产生规模化,不是一家生产出T型车,而是所有汽车产业生产出T型车和Y型车,这才是AI定义世界的本质。

 

胡延平:这也让我重新理解了你们的生态卡位,不是说我有什么,我为企业和客户做什么,而是要能够赋能更多的人,让大家去做,你们去提供平台和基础能力。

 

田丰:还有另外一个例子,截至目前,搭载商汤SDK的手机已累计出货15亿台,客户覆盖中国头部手机厂商;另外商汤的SenseMARS元宇宙赋能平台,正在支持超过200多个移动应用程式及手机游戏,赋能超过60个大型商场、博物馆及机场……这也可以从另外一个层面看到AI算法怎么定义硬件终端。

 

胡延平:现在苹果、华为、三星、OPPO、VIVO、小米,大家全力以赴都在做计算摄影,基于小小的传感器,可能感观面积只有微单八分之一、十分之一,去实现2K、4K甚至8K高清画质。这里实时堆栈、多帧合成、多次曝光画面的智能还原,你们的智能图像引擎可以让这些企业好好用起来。

 

田丰:甚至影视行业,李安导演喜欢拍120帧,但是很多电影拍比较小帧率,我们可以用算法做超分插帧,从60帧变成120帧,专业电影可以通过算法赋能百帧,可以让入门级导演团队拍出高帧率。

 

胡延平:动画产业苦苦以求,以前一帧一帧都是动画师画出来的。

 

田丰:《阿丽塔》的视效是由三万台电脑制作出来的。现在可以通过算法直接把《小蝌蚪找妈妈》这种原来的动画片超分辨率超出来,我们叫AIGC。AI创造内容是未来的模式,或者叫AI- Native的影视行业变化。

 

胡延平:各行各业关于内容的生成角度,就不需要再耗费大量的人工。

 

田丰:比如说我们现在的直播场景可以换到喜马拉雅山、月球上、太空站,换背景。

 

胡延平:手机里图像传感器叫CMOS,目前还是使用了硅基,如果应用了有机半导体、量子薄膜,我相信再过几年不用买佳能25C、尼康Z9或者是索尼A1这样几万、十几万8K的设备,我们用一个手机就行。

 

田丰:另外一个硬件方面的趋势,芯片层面怎么破局呢?如果按传统架构很难突破。现在出现一些新的架构,比如光芯片、量子芯片、碳基芯片,这些都是我们国家基础研发正在做探索的,而且光芯片领域去年中科院还取得了一些进展。

 

我们相信软件和硬件就像两个正弦波,硬件进入基础开发期,没有技术红利的时候,软件开始创造红利,软件创造出新一批红利硬件又开始起来,软件基于硬件高性能再创造新一代的红利,永远是波峰波谷的关系。

 

胡延平:智力带动算力、算力驱动智力这样良性过程,这里既有线性摩尔定律的成长,也有体系结构的成长。

 

田丰:应该说摩尔定律的红利现在吃的差不多了,未来十几年可能要进入硬件的基础研发期,那软件就要高速发展,可以给世界更多红利。

 

胡延平:如果去看下一个五年、十年,你们认为比较现实的,在近两年,你们的AI大装置去应用到的一些关键产业或者是目标案例领域有哪些?

 

田丰:AI的市场渗透仍然处在早期,大多数的城市、企业、以及汽车等IoT设备依然是亟待AI渗透的空白。随着中国数字经济建设的加快,各行业AI的渗透率将会迅速提高,蕴含着巨大的增长机会。商汤将通过提供AI-as-a-Service,即智能计算服务,把SenseCore的能力进一步对市场开放。城市、企业的全面数字化,以及数字世界和无人驾驶技术的生产和运用,都对人工智能计算服务产生庞大的市场需求。我们希望把AI算力算法和数据能力赋能到新终端上,未来3年内有可能出现千元内的AR眼镜,那大家对数字世界就会更有感知。

 

胡延平:智能手机的销量从1000万上到一个亿,再到现在每年几千亿的销量,就是因为有千元机开始的。

 

田丰:是的,我认为很有可能是背后算法赋能,让低成本AR眼镜拥有各种各样的功能。此外还有AI软件定义汽车,车、路、云这三者实际上是一体的,包括算法是云车耦合,甚至路、路灯、传感器是一体化耦合。中国很有可能先产生智能路网,像保险员一样,不管什么车进来都可以达到非常高智能驾驶的水平。通过路网弥补车上智能差异,最后形成车路一体的智能体。所以智能驾驶领域,也是由AI软件定义智能路,加上聪明的车,成为非常好的自动驾驶生态圈。

 

胡延平:在这个方向上有很多企业在做,自动驾驶、无人驾驶创业团队,国内像星驰、黑蚂蚁、地平线、寒武纪、百度等等,国外有Intel收购的mobileeye等,业态还处于正在各就各位的过程当中,大家互相都会做对方也会做的事。那么在这个生态里,三年、五年以后,你们更清晰的卡位在哪?

 

田丰:智能汽车正在从传统的“制造”到“制造+服务”模式转变。从算力的角度看,智能汽车的算力是智慧城市视觉感知终端算力的百倍,是智能手机的几十倍。智能汽车就是一个巨大的、移动的数据生产源,关键是如何通过人工智能算法去挖掘这些数据背后的价值。智能感知是商汤的核心能力,我们的众多业务也是围绕着挖掘感知数据的价值。

 

智能汽车是下一个智能感知的最大载体。SenseCore商汤AI大装置正通过超级算力和超大模型,为智能汽车构建通用智能的能力解决大量的长尾问,推动智能汽车与各个产业相互融合,不断创新驾乘体验。商汤以“一横一纵”的方式打造了智能汽车的创新底座,推出了智能汽车解决方案的独立品牌——SenseAuto商汤绝影智能汽车平台。

 

“一纵”是指能够提供智能驾驶和智能车舱的全栈解决方案,“一横”是指将基础的软硬件设施提供给车厂和合作伙伴,赋能不同的主机厂。商汤也建立起路云感知平台,将车载数据、路端感知数据和其他行业的数据汇集起来,不断拓展智能汽车的应用场景。

 

胡延平:在智能汽车角度,你们对市场的覆盖情况如何?

 

田丰:最新数字还需要统计。2021年,商汤的智能汽车业务合作车企客户数超过30家,国内主流车企及部分海外车企均成为合作客户;商汤的智能驾驶和智能座舱产品累计前装定点数量达2300万台,覆盖未来五年内量产的60多款车型,将为我们带来业务规模化增长。

 

胡延平:接下来三五年,行业和消费者都在看几个问题,一个是L2、L3市场渗透率能到多少?大家也在关注新能源在未来五年的渗透率如何?还关注什么时候这种“三位一体”智能汽车渗透率达到一些标准?能不能有一个时间表?

 

田丰:自动驾驶有L1~L5,但是坦率来说,“三位一体”综合智慧路网还没有评级,所以这块渗透率目前权威机构没有统计。但是从我们对产业观察来看,可以看到一个趋势,就是在过去三年,有点像大家在做点状的技术,但是在未来3~5年,大家会以软硬集成的方式,真正会出现汽车软硬一体操作系统。就像手机一样,为什么千元机普及了?因为难度集中在某些专属的部件上,只要嵌入就行了,其他就是一个壳子。汽车这个领域在未来3~5年形成软硬一体汽车中枢网络,包括路端的东西。因为没有标准化,意味着很难做全国普及甚至全球普及。

 

在未来五年,汽车智能化会随着软件或者AI成熟算法嵌入到预控甚至芯片硬件平台,会大量进行普及。这需要一些时间,大家还在做智能车舱,像刚才说“三位一体”成熟算法。

 

因此,现在消费者买车更多看到点状的功能点,有一些点状功能点很受欢迎,比如做刷脸开车,不需要带手机,也不需要钥匙;手势控制、多模态语音交互等等。我们汽车上也有数字人,这个数字人会识音,进行功能性服务。未来智能汽车的渗透率毋庸置疑,新能源车要考虑的问题是,中国哪一年不卖燃油车。欧洲已经宣布2030年不卖燃油车了,新能源车是大势所趋,渗透率会在十年间快速接近100%。

 

此外,还有商汤SenseMARS火星混合现实平台含有超3500多个AI模型,可为各类数字世界应用提供强大支持,甚至基于城市级大尺度高精三维数字化空间构建应用等等;商汤生产的数万个AI模型在汽车、手机、城市空间和商业空间里,已经赋能了超过十亿台的IoT设备,每天在执行著上万亿次AI推理操作,实现著我们连接物理世界和数字世界的愿景。

 

你可以认为每一个平台是这个产业里的AI工厂,源源不断产生各种商用模型。对于20后这一代人AI可能是非常普遍的,不叫黑科技,是世界本来应该有的。

 

所以他们很可能变成AI Native Generation。对于18~35岁之间的人,会觉得这个东西能改变世界,会利用AI工具箱定义世界。对于35岁之后,一种是心态很年轻拥抱创新,会成为创新的一部分,还有一种觉得会有很多的风险,因为大家会更喜欢稳、定确定性强的东西,这是不同代际的人会去看科技的态度。

 

胡延平:从互联网90年代到2000年代到2010年,80后、90后属于互联网原住民,对于他们来说,一切皆能上网。但是对于50后、60后、70后有适应过程。现在在AI阶段又有同样的问题,AI原住民在AI原生世界里,可能对于00后或者10后或者是20后来讲,天生是AI世界。

 

田丰:你看这一代小朋友天天戴口罩上学,他觉得不应该触摸屏幕,因为有疫情。就应该是Air touch.

 

胡延平:对于原住民反倒有强烈不安全感。当一个城市有这么多科技进行管理和维护的时候,大家倒有安全感。每一个井盖有传感器的时候,90年代我在新闻媒体工作的时候,当时媒体会把什么作为新闻—— 哪有个井盖被人偷了,结果骑自行车掉进去了。这是所预期的AI原生世界里的安全性问题,包括交通事故率的降低。

 

我记得在2017、2018年,周围相当一部分人在讲,智能驾驶不靠谱,大概比划比划而已。但是现在越来越多的人倾向于如果不用自动驾驶未来死亡率更高,上路更不安全。

 

AI是新时代生产力工具

 

胡延平:除了憧憬未来,我们也有一些底层的担忧,或者对根本问题的思考。这些技术、新科技一方面让我们变的更安全,但是为什么同时又隐隐有不安全感。这个不安全感问题怎么解决?

 

田丰:新时代生产力工具是AI,但是大家比较担心的是,坏人去用这个生产力工具,而不是放在好人手里。为了服务社会推动正向目标,所以这个工具交给谁?举一个基础科研的例子,核力电研究可以产生新能源核电站,也可以造原子弹。工具本身的方向盘一定是掌握在人手里,AI要实现技术可控。

 

胡延平:现在业内在讲算法透明,你觉得应该接受什么程度的监管?

 

田丰:比喻一下,现在AI非常像蒸汽机,路还很长。当蒸汽机用在车上的时候,我们就要定义高速公路的发展规则,这是会极大影响产业和科技发展。大家可以想一个事情,对于已知风险和可预测风险可以做监管,尤其是高风险。但对于基础科研,大量是未知的风险和未知的价值,这时候如果用高监管、强智力,那未知的价值就可能弱化了,可能我们会无限夸大未知风险。这种情况下,我们更多的希望在基础科研领域,要有宽松的环境,这样才能够在现在全球竞争中脱颖而出,而对于已经发生风险要采用敏捷的智力、分级、分域、分行业治理的模式,这是我们的建议。

 

胡延平:之前有提到AI的普世性,我常说数字普惠,这两者有点不约而同。AI实现向善发展,在这方面你认为有好的解决办法吗?

 

田丰:分几步走,第一让所有人理解AI,像咱们的节目特别好,让年轻人、老年人、小朋友等等都理解AI。商汤也有AI教育产品,目前已经推向全国近3000多所中小学了,让小朋友懂AI,并且教他们正向伦理价值观。

 

第二,能不能通过AI去形成公共服务的改善和治理,这很关键。因为公共服务永远影响大多数人,而公共服务普惠性很重要。如果一个东西普惠了,变成像手机这样的东西,不会被少数人所控制了,谁都可以用、谁都可以开发做创新,这本身就是全民化的技术。AI十年以后就是现在的PC、现在的手机。

 

第三,技术还在高速发展之中,科研创新速度是很关键的。能不能做到普惠的科研,这分两个含义,一是科学家让AI更快速发展,比如用AI设计AI芯片;第二是传统技术研发领域、新材料、新能源、新医药等等,能不能用AI去加速科研过程,这是科研的普惠化。

 

简单来说刚才三点,第一大众普惠化,第二公共服务化,第三科研普惠化。

 

胡延平:还有一个问题,新型数字基础设施目前是各方面非常重视也是接下来会有很大力度去做的一件事。关于AI基础设施,现在迫切需要提升认知,我们构建AI基础设施的时候,整体判断、整体架构,包括相应路线图是什么?要不然是巨额投资的浪费。

 

田丰:有两个结论,飞机场比飞机更重要,不会先造一千架飞机没有地方落,现在AI智能计算中心远远比AI工厂重要,只有更多算力融合才能产生新应用和新终端。

 

第二在多数计算大架构底下,要充分考虑数据迁移成本。真正产生数字经济价值的地方,往往人比较多,因为人有需求,同时GDP比较高,因为有消费潜力,数字经济实际上跟着实体经济走。这就是为什么沿海地区数字经济需求很大,而基建很旺盛。东数西算,实际上东边数据挪到西边有巨大成本,西边能不能创造更多数字经济需求和产业需求出来,这很关键。比如,西边现在有汽车产业集群、有元宇宙文创产业集群,可能还会有其他地方特色的集群。真正实体经济需求、虚实融合的需求才是数字经济和实体经济相融合,导致新基建东边和西边同时发展起来的基础。

 

胡延平:今天时间过的很快,一转眼已经两个小时了。新物种研究院这期《甦对谈》我认为干货很多,关键是底层逻辑、核心框架非常清晰,三个范式、四个世界、包括算力的四个方面、四个平台,非常巧,其实就是四个关键问题。

 

新物种研究院《甦对谈》给大家提供思考问题的角度,这个角度以及所牵出来关键信息,如果有助于大家判断这个未来的可能性,以及所有正在发生事情的实质,如果能起到这么一个作用,我们已经非常欣慰了。

 

今天甦对谈到此结束,谢谢!