申请试用
登录
核心技术
以原创技术体系为根基,SenseCore商汤AI大装置为核心基座,布局多领域、多方向前沿研究,
快速打通AI在各个垂直场景中的应用,向行业赋能。

走进AI科学之美

2019-09-16

人工智能和机器学习的未来研究方向是什么,人们如何使用这项技术去解决诸多科学领域的问题?去年,麻省理工学院与商汤科技共同成立了MIT-商汤科技人工智能联盟,致力于全方位人工智能原创技术的研发,推动人工智能技术突破,并支持MIT在人工智能领域进行最前沿跨学科探索研究。


而在不久前结束的2019世界人工智能大会(WAIC 2019)上,麻省理工学院名誉校长Eric Grimson在商汤科技“智焕新动能”人工智能主题论坛中,带来了一堂《走进AI科学之美》的主题演讲,分享了麻省理工学院的最新研究和观点,如下是一些精彩摘录,分享给大家。


1.jpg


  现代认知科学能为AI发展提供哪些建议?


首先,观察人工智能过去60年的演进。在1956年,人工智能这个词被首次提出以来,AI就不仅仅是一个能够执行智能任务的计算系统,而是将人类对人类智慧的理解作为其发展指南,这在当时是一个巨大的创新。我们从过去60年的人工智能研究中看到了很多趋势,目前一些趋势是将现代神经科学和认知科学的研究与人工智能研究相结合。


由此,我们不禁要问,现代神经科学和认知科学对未来的AI算法提出了什么建议?


当前的深度学习成果令人叹为观止,例如AlphaGo击败人类职业围棋选手或计算机已能够比人们更好地识别面部特征,但是这些系统往往需要数以亿计的训练样本和大量的计算能力。然而,对比一下,一个年幼的孩子可以通过极少的例子就能进行学习或推理。


现代认知发展的研究表明,人类幼儿在学习方式上比以前认为的要复杂得多,幼儿不只是进行模式匹配,而是探索并形成认知结构。例如,麻省理工学院脑与认知科学系教授Laura Schulz已经证明,儿童经常创造与物体或情境相关的假设,然后通过观察或实验对其进行测试。她的研究表明,儿童可以通过实验形成并检验假设,并可以通过最终结果和因果关系来进行归纳和概括。这种学习理论,尤其是从少数例子中学习的能力,为我们提出不同的人工智能演进算法的方法。


基于这个想法,让我们从麻省理工学院脑与认知科学系教授Josh Tenenbaum的一个不寻常的例子开始。假设有50个不同的字符,包含1600个简单的视觉概念,但是每个概念只提供了20个示例,因此这个训练数据非常有限。实验结果表明,人们非常擅长识别字符并进行配对,机器可以与人类一样或者超越人类。以单个手绘字符为例,计算机已可以正确找到匹配的字符。


2.jpg


Josh Tenenbaum教授利用了字符生成的逻辑并将其扩大。假设用户构建了一个物理模拟引擎,可以生成任何操作的图像序列,而不仅仅是对字符的笔画生成进行建模,包括允许可以创建随机变量。然后,用户可以像孩子搭积木一样预测操作的结果。在此逻辑下,他通过一系列引擎和概率程序创建了模拟幼儿行为的人类智能模型。通过使用感知观察结果并不断改进对于系统的理解,整个系统可以随着时间的推移学习,就像新生儿一样开始学习,逐渐成长为一个两三岁的孩子。这种方法可能引入一种非常不同的学习方式——一种需要很少的例子,但通过模拟训练达到目的的方式。


3.jpg


  数学可以改进当前的机器学习方法吗?


除了使用神经科学和认知科学来更好地理解人工智能和机器学习系统以及构建新方法之外,机器学习背后的数学基础也很重要,如何知道是否信任人工智能系统提供的答案?系统有多强大?系统中存在隐性偏见吗?这里向大家展示麻省理工学院当前研究项目的例子,其中包括这些问题。


如果训练数据能够很好地代表测试数据,那么深度学习系统会很可靠。但是,如果用选定的干扰程序攻击系统,AI可能会被愚弄。是否有一种数学上合理的方法来创建更强大的系统?


最近,许多研究结果表明深度神经网络可能非常脆弱,对一个样本加入微小的干扰就可能导致明显的分类错误。麻省理工学院电子工程和计算机科学系副教授Aleksander Madry为了解决这个问题,创建更鲁棒的分类器,他提出把这个问题当作一个博弈论问题来处理。


这种方法的关键在于不仅仅在真实数据,而且要在受扰动的样本上训练模型。理想的情况下,我们要针对所有可能的扰动进行训练,但是这是不可能的,因为数量太多了。通过实验,Madry观察到,只要在特征空间中选择有限数量的邻近点就足够了,因为损失函数的值在一个小区域内不会有很大的变动。通过有选择地针对扰动进行训练,可以构建出更鲁棒的神经网络。在标准数据集上的实验显示,他的方法确实显著改善了分类系统的鲁棒性。


5.jpg


  人工智能系统如何帮助传统科学领域?


除了考虑机器学习背后的科学,我们也要思考人工智能系统如何帮助到传统科学领域去解决一些问题。


材料科学家和计算机科学家共同创建了一个人工智能系统,可以阅读科学论文并提取“配方”以生产特定类型的材料。他们的系统从理论上为创建材料提供配方,例如提供材料的物理特性以及设计制造这种材料的方法,同时,该系统可以识别更高级别的模式,例如,能够识别材料配方中使用的前体化学品与所得产品的晶体结构之间的相关性。此外,该系统还提供了生成原始配方的自然机制,研究人员可通过这种机制为已知材料建议替代配方。这项研究工作的应用在可再生能源中尤为重要。


第二个例子是将一组反应物转化为目标化合物的研究。合成化学是一门艺术,通常由经验丰富的化学家执行。麻省理工学院材料科学与工程系教授Klavs Jensen及其同事正在创建一个预测结果的框架,该结果将传统使用的反应模板与神经网络模式识别的灵活性相结合,可应用于包括药物设计等领域。


6.jpg


麻省理工学院研究科学家Caleb Harper及其同事将环境与气候控制、代谢表型测量和机器学习相结合,以更好地了解食物生长的生物学过程。利用机器学习研究光照条件与挥发性风味物质的分子浓度之间的相关性,可以更深入地了解食品生产的化学过程。这项工作旨在开发含有更高水平化合物的植物,可以用于帮助对抗糖尿病等疾病。


7.jpg


以上的一系列示例展示了麻省理工学院的研究人员如何研究构成当前和未来人工智能系统基础的科学,以及这些系统如何帮助科学家回答有关物理世界的基本问题。