申請試用
登錄
新聞中心

商湯及聯合實驗室37篇論文入選ECCV 2018,識別、檢測與場景分析等技術獲關鍵突破

2018-09-08

9月8日-14日,備受矚目的2018歐洲計算機視覺大會(ECCV 2018)在德國慕尼黑召開,ECCV兩年舉辦一次,與CVPR、ICCV共稱為計算機視覺領域三大頂級學術會議,每年錄用論文約300篇。根據ECCV 2018宣佈的最終結果,商湯科技及聯合實驗室共有37篇論文入選,超過微軟、谷歌、Facebook等科技巨頭。商湯科技ECCV 2018錄取論文在以下領域實現突破:物體檢測與跟蹤、自動駕駛場景理解與分析、視頻分析、3D視覺、底層視覺算法、視覺與自然語言的綜合理解等。這些新穎的計算機視覺算法不僅有著豐富的應用場景,使得更多的智能視覺算法能應用於日常生活之中,還為後續研究提供了可貴的經驗和方向。

 

如入選論文《量化模仿-訓練面向物體檢測的極小CNN模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》,本文提出一種簡單而通用的框架—量化模仿,來訓練面向物體檢測任務的極小CNN模型。作者提出聯合模仿與量化的方法來減小物體檢測CNN模型的參數量實現加速。在有限計算量的限制下,該框架在Pascal VOC和WIDER Face數據集的物體檢測性能均超越了當前物體檢測的先進水平。

 

而在幾個月前舉行的CVPR 2018會議上,商湯科技、香港中文大學-商湯科技聯合實驗室以及其他商湯科技聯合實驗室共有44篇論文中稿,商湯科技今年累計入選計算機視覺頂會論文數量達到81篇。

 

商湯科技聯合創始人、商湯研究院院長王曉剛表示,「商湯始終堅持對原創技術的極致追求,正是這種精益求精的精神讓商湯在諸多計算機視覺前沿技術領域上不斷取得新突破,亦在行業應用方面全面落地。本次會議,華人入選ECCV 2018 的論文數量非常搶眼,近年來華人學者們對原創研究孜孜不倦的堅守,鑄造CV技術領域的一股新力量。」

 

參加COCO 2018和VOT 2018均奪冠

商湯原創技術的不斷進步亦在重要的比賽中得到驗證。在2018年的COCO比賽中,商湯科技研究員和香港中文大學-商湯聯合實驗室同學組成的團隊,在核心的物體檢測(Detection)項目中奪得冠軍。 

 

在此次競賽中,商湯團隊創造性地開發了三項全新的技術,獲得了大幅度的性能提升:

 

(1)新的多任務混合級聯架構(hybrid cascade)。通過將不同子任務進行逐級混合,這種新架構有效地改善了整個檢測過程中的信息流動。

 

(2)通過特徵導引產生稀疏錨點,而不是使用傳統的規則分佈的密集錨點。這種特徵導引的方案使得錨點的投放更為精准,平均召回率提升了超過10個百分點。

 

(3)採用一種新型的FishNet網絡結構,它有效地保留和修正多個尺度的信息,能更有效地用於圖像級,區域級,以及像素級預測任務。

 

在test-dev上,商湯團隊對上述框架進行了全面測試,其中單模型和多模型(最終提交的結果來自於五個模型混合的框架)的mask AP分別達到了47.4% 和49.0%,比去年冠軍(亦是商湯團隊獲得)的結果,44.0% 和46.3%,有約3個百分點的明顯提高。 在傳統的基於檢測框的指標bbox AP上,這個新的框架亦分別達到了單模型54.1%和多模型的56.0%的性能,比去年冠軍的結果,50.5%和52.6%,亦有較大的提升。

 

值得一提的是,為了推動視覺檢測技術的進一步發展,在ECCV期間,香港中文大學-商湯聯合實驗室還開源了檢測庫mm-detection(https://github.com/open-mmlab/mmdetection)。這個開源庫提供了已公開發表的多種視覺檢測核心模塊。通過這些模塊的組合,可以迅速搭建出各種著名的檢測框架,比如Faster RCNN,Mask RCNN,和R-FCN等,以及各種新型框架,從而大大加快檢測技術研究的效率。

 

此外,商湯科技團隊還參加了視覺目標跟蹤大賽VOT Challenge,並在實時跟蹤項目獲得第一名,這一成績體現了商湯在視覺目標跟蹤技術的新突破。

 

VOT Challenge是視覺目標跟蹤領域一年一度的國際權威比賽,其為跟蹤領域提供了精細的數據標注和評測方式,並在2017年引入了實時比賽:被評測算法在跟蹤物體的同時必須保持至少60fps跟蹤速率,來模擬現實場景中的跟蹤情況。

 

今年的VOT 2018在ECCV 2018期間舉辦,共有72只隊伍參賽,包括微軟亞洲研究院、牛津大學等知名企業與高校。商湯科技的參賽算法能夠在60FPS的速率下獲得精確的跟蹤結果,並且在其他兩項項目(普通跟蹤和長時跟蹤)也獲得了驕人的成績。

 

舉辦新型大賽 推動人工智能行業發展

商湯不止於在頂級計算機視覺大賽上獲得好成績,還致力舉辦行業大賽,制定行業標準,推動人工智能行業發展。

 

今年8月,商湯科技攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡稱:WIDER Challenge)挑戰賽獲得圓滿成功。作為一項全新的全球頂級計算機視覺競賽,共吸引來自世界各國超過400支隊伍報名。

 

商湯作為主辦方制定了全新標準數據集——WIDER Face數據集、WIDER Pedestrian專門用於行人檢測的大規模數據集和WIDER Person Search人物檢索數據集,促進高性能算法湧現。

 

未來,商湯將繼續賦能AI創新大賽,加速推進以人工智能為核心的創新技術,帶動行業應用和產業融合的持續深入。