- 新闻中心
商汤及联合实验室37篇论文入选ECCV 2018,识别、检测与场景分析等技术获关键突破
9月8日-14日,备受瞩目的2018欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,ECCV两年举办一次,与CVPR、ICCV共称为计算机视觉领域三大顶级学术会议,每年录用论文约300篇。根据ECCV 2018宣布的最终结果,商汤科技及联合实验室共有37篇论文入选,超过微软、谷歌、Facebook等科技巨头。商汤科技ECCV 2018录取论文在以下领域实现突破:大规模人脸与人体识别、物体检测与跟踪、自动驾驶场景理解与分析、视频分析、3D视觉、底层视觉算法、视觉与自然语言的综合理解等。这些新颖的计算机视觉算法不仅有着丰富的应用场景,使得更多的智能视觉算法能应用于日常生活之中,还为后续研究提供了可贵的经验和方向。
例如,商汤入选ECCV 2018论文《人脸识别的瓶颈在于数据集噪声(The Devil of Face Recognition is in the Noise)》中,对于现有人脸数据集中的标签噪声问题进行了深入研究,对MegaFace和MS-Celeb-1M数据集中的噪声特性和来源做了全面的分析,发现干净子集对于提高人脸识别精度效果显著
再如入选论文《量化模仿-训练面向物体检测的极小CNN模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》,本文提出一种简单而通用的框架—量化模仿,来训练面向物体检测任务的极小CNN模型。作者提出联合模仿与量化的方法来减小物体检测CNN模型的参数量实现加速。在有限计算量的限制下,该框架在Pascal VOC和WIDER Face数据集的物体检测性能均超越了当前物体检测的先进水平。
而在几个月前举行的CVPR 2018会议上,商汤科技、香港中文大学-商汤科技联合实验室以及其他商汤科技联合实验室共有44篇论文中稿,商汤科技今年累计入选计算机视觉顶会论文数量达到81篇!
商汤科技联合创始人、商汤研究院院长王晓刚表示:商汤始终坚持对原创技术的极致追求,正是这种精益求精的精神让商汤在诸多计算机视觉前沿技术领域上不断取得新突破,也在行业应用方面全面落地。本次会议,华人入选ECCV 2018 的论文数量非常抢眼,近年来华人学者们对原创研究孜孜不倦的坚守,铸就CV技术领域的一股新力量。
参加COCO 2018和VOT 2018均夺冠
商汤原创技术的不断进步也在重要的比赛中得到验证。在2018年的COCO比赛中,商汤科技研究员和香港中文大学-商汤联合实验室同学组成的团队,在核心的物体检测(Detection)项目中夺得冠军。
在此次竞赛中,商汤团队创造性地开发了三项全新的技术,获得了大幅度的性能提升:
(1)新的多任务混合级联架构(hybrid cascade)。通过把不同子任务进行逐级混合,这种新架构有效地改善了整个检测过程中的信息流动。
(2)通过特征导引产生稀疏锚点,而不是使用传统的规则分布的密集锚点。这种特征导引的方案使得锚点的投放更为精准,平均召回率提升了超过10个百分点。
(3)采用一种新型的FishNet网络结构,它有效地保留和修正多个尺度的信息,能更有效地用于图像级,区域级,以及像素级预测任务。
在test-dev上,商汤团队对上述框架进行了全面测试,其中单模型和多模型(最终提交的结果来自于五个模型混合的框架)的mask AP分别达到了47.4% 和49.0%,比去年冠军(也是商汤团队获得)的结果,44.0% 和46.3%,有约3个百分点的明显提高。 在传统的基于检测框的指标bbox AP上,这个新的框架也分别达到了单模型54.1%和多模型的56.0%的性能,比去年冠军的结果,50.5%和52.6%,也有较大的提升。
值得一提的是,为了推动视觉检测技术的进一步发展,在ECCV期间,香港中文大学-商汤联合实验室还开源了检测库mm-detection(https://github.com/open-mmlab/mmdetection)。这个开源库提供了已公开发表的多种视觉检测核心模块。通过这些模块的组合,可以迅速搭建出各种著名的检测框架,比如Faster RCNN,Mask RCNN,和R-FCN等,以及各种新型框架,从而大大加快检测技术研究的效率。
此外,商汤科技团队还参加了视觉目标跟踪大赛VOT Challenge,并在实时跟踪项目获得第一名,这一成绩体现了商汤在视觉目标跟踪技术的新突破。
VOT Challenge是视觉目标跟踪领域一年一度的国际权威比赛,其为跟踪领域提供了精细的数据标注和评测方式,并在2017年引入了实时比赛:被评测算法在跟踪物体的同时必须保持至少60fps跟踪速率,来模拟现实场景中的跟踪情况。
今年的VOT 2018在ECCV 2018期间举办,共有72只队伍参赛,包括微软亚洲研究院、牛津大学等知名企业与高校。商汤科技的参赛算法能够在60FPS的速率下获得精确的跟踪结果,并且在其他两项项目(普通跟踪和长时跟踪)也获得了骄人的成绩。
举办新型大赛 推动人工智能行业发展
商汤不止于在顶级计算机视觉大赛上获得好成绩,还致力举办行业大赛,制定行业标准,推动人工智能行业发展。
今年8月,商汤科技携手香港中文大学、亚马逊、南洋理工大学、悉尼大学联合举办的首届WIDER Face and Pedestrian Challenge 2018(简称:WIDER Challenge)挑战赛获得圆满成功。作为一项全新的全球顶级计算机视觉竞赛,共吸引来自世界各国超过400支队伍报名。
商汤作为主办方制定了全新标准数据集——WIDER Face人脸检测数据集、WIDER Pedestrian专门用于行人检测的大规模数据集和WIDER Person Search人物检索数据集,促进高性能算法涌现。
未来,商汤将继续赋能AI创新大赛,加速推进以人工智能为核心的创新技术,带动行业应用和产业融合的持续深入。