申請試用
登錄
新聞中心

60篇論文入選,兩度奪魁,「 史上最難ECCV 」商湯再攀高峰

2020-08-25

8月23-28日,全球計算機視覺三大頂會之一,兩年一屆的歐洲計算機視覺國際會議ECCV(European Conference on Computer Vision) 正式召開。


與今年六月舉辦的CVPR 2020類似,本屆ECCV 2020亦堪稱「史上最難ECCV 」——有效投稿5025篇,比ECCV 2018的兩倍還多,而最終被接受發表的論文僅1361篇,錄取率為27%,較上屆下降約5%。


TU1.png

 

雖然競爭加劇,但商湯科技在ECCV 2020依然斬獲傲人成績,商湯及聯合實驗室一共有60篇論文入選,涵蓋對抗式生成模型、三維點雲理解與分析、視頻理解與分析、目標檢測等熱門及前沿領域,再次展示了商湯在計算機視覺領域的科研及創新實力。

 

不僅在論文總數上引領行業,商湯還斬獲ECCV LVIS Challenge 2020冠軍,以及由蘇黎世聯邦理工學院(ETH)主辦的ECCV AIM 2020冠軍。


深耕研究,做真正具有行業價值的學術研究,是商湯在AI頂級會議上屢創佳績的根源。


ECCV 2020斬獲兩項世界冠軍


ECCV LVIS Challenge 2020是本屆ECCV最重磅的競賽之一,LVIS 是 FAIR (Facebook人工智能實驗室) 在2018年提出的一個用於長尾識別的實例分割數據集,其有超過1000個類別,同時類別具有長尾分佈的特性,此外,LVIS的標注相比COCO亦更加精細。


商湯科技研究團隊在今年針對這兩個特性創新地使用了一個二階段的訓練策略,特徵學習階段和微調階段,以更加高效地解決類別不均衡和高質量Mask預測問題。


除算法改進之外,基於商湯內部的SenseSpring商湯深泉模型生產平台實現了靈活高效和更高精度的模型訓練。最終在LVIS Challenge 2020上獲得了第一名的好成績,實現了LVIS比賽的兩連冠。


TU2.jpg

 

由ETH主辦的AIM比賽,來自商湯科技-中科院深圳先進研究院的XPixel團隊獲得了視頻插幀(Video Temporal Super-Resolution)冠軍。這也是商湯連續兩屆在AIM VTSR項目中奪冠。


TU3.png


視頻插幀是一種可以提升視頻幀率,改善視頻流暢度的技術。


XPixel團隊從原有模型出發,改進了對視頻運動的建模,使得模型更加符合真實運動軌跡;並且針對生成幀提出了新的改善模組,使效果獲得了進一步的提升。