5月21日,清華大學車輛與運載學院2016級碩士研究生余大蒙(導師為李克強教授)提出的一種基于深度卷積神經網絡的車載視覺實時聯合感知模型,在自動駕駛領域國際著名的KITTI目標檢測與朝向估計(Object Detection and Orientation Estimation)評測任務中,獲得行人類別的第一名(1/74),同時獲得了車輛類別第三名(3/139)。

實時聯合感知模型的目標檢測和朝向估計效果圖
實時聯合感知模型基于車載單目視覺,使用單幀圖像作為模型輸入,同時輸出車輛、行人和騎車人等動態目標的三維位置、朝向、類別和尺寸信息及道路分割結果。在KITTI行人檢測與朝向估計評測中,該模型以70.57%的平均朝向相似性(Average Orientation Similarity,用于聯合評估檢測精度與朝向估計精度的評價指標),大幅領先第二名67.66%的成績名列榜首;同時,0.06秒的單幀算法耗時也大幅低于其他方法。斯坦福大學、多倫多大學、馬克斯-普朗克研究所、香港中文大學等全球多個國際頂尖研究團隊參與了這兩項KITTI評測任務的競爭。

KITTI行人類別的朝向相似性-召回率曲線
李克強教授帶領的智能車輛團隊在智能網聯汽車領域已有多年的研究,在該領域頂級的國際期刊與國際會議發表了多篇高水平論文,同時擁有多項相關發明專利。團隊圍繞智能網聯汽車及新能源汽車,探討人工智能和自動控制在下一代汽車的應用,聚焦感知、決策、控制等核心技術研發,努力提升下一代汽車的安全、節能、環保、舒適等綜合性能。