特斯拉“行為克隆”技術曝光:無需寫代碼,實現全自動駕駛?

時間:2019-01-29

來源:手機中國網

0

導語:特斯拉最近曝光“行為克隆”技術,系統研究人類在各種場景中的駕駛動作并加以模仿。巧合的是,自動駕駛第一大廠Waymo不久前也在公布了模仿學習中的技術細節。模仿學習會成為全自動駕駛的一條捷徑嗎?

特斯拉最近曝光“行為克隆”技術,系統研究人類在各種場景中的駕駛動作并加以模仿。巧合的是,自動駕駛第一大廠Waymo不久前也在公布了模仿學習中的技術細節。模仿學習會成為全自動駕駛的一條捷徑嗎?

全自動駕駛的“捷徑”來了?

知情人士表示,特斯拉汽車收集了大量的來自攝像頭和其他傳感器的數據,即使Autopilot系統沒有開啟,開發團隊也可以研究傳統的人類在各種場景中的駕駛動作并加以模仿。

這種技術被稱為“行為克隆”,實際上是一種模仿學習(imitation learning)。

系統使用模仿的信息作為車輛在特定情況下決定駕駛方式,比如,行駛彎道或避開前方目標等。

無獨有偶,為了模仿專家駕駛,自動駕駛大廠Waymo不久前也創建了一個名為ChauffeurNet的深度RNN,該網絡通過觀察場景的中層表示作為輸入,訓練它發出駕駛軌跡,最終的結果能超越純粹的模仿。

此外值得注意的是,上周AlphaStar戰勝人類選手之,就涉及到模仿學習。AlphaStar只通過觀察人類如何玩游戲,就能模仿學習策略,最后將信息用于訓練各種智能體。

現在,自動駕駛界的兩只領頭羊都在嘗試做模仿學習,這會成為全自動駕駛的一條捷徑嗎?

特斯拉行為克隆:未來人們不需要寫代碼了

特斯拉的自動駕駛系統Autopilot的核心功能與其他半自動駕駛系統和全自動駕駛系統類似:在Autopilot可以運行之前,特斯拉從汽車的傳感器(如前置攝像頭)收集數據。

之后公司雇人對圖像中的汽車和其他物體進行數字標記,然后將一些圖像輸入神經網絡計算系統,該系統會對其他車輛及其行進方式進行模式識別,并且隨著時間的推移提高車速。

通過神經網絡提供足夠的真人駕駛數據,網絡就可以學習如何在大多數情況下直接預測正確的轉向、制動和加速行為。

但特斯拉不同的地方在于,“行為克隆”讓Autopilot開發團隊也可以研究傳統的人類駕駛在各種場景中的動作,從而加以模仿。

這樣做的結果是,你不需要任何其他東西來教系統如何自主駕駛,在未來,人們不需要編寫代碼來告訴汽車在遇到特定情況時該怎么做,因為汽車自會知道該怎么做。

這個概念被特斯拉的一些工程師稱為“軟件2.0”。

深度理解模仿學習:未來或能交叉預測其他智能體的反應

“軟件2.0”可能是一種產品概念,“行為克隆”的背后是技(學)術概念——模仿學習。

目前,特斯拉對于模仿學習的詳細介紹資料比較少,但是Waymo去年11月發的一篇論文,可以窺見模仿學習的部分技術原理。

特斯拉“行為克隆”技術曝光:無需寫代碼,實現全自動駕駛?

Waymo創建的ChauffeurNet的深度遞歸神經網絡(RNN),通過觀察場景的中級表示作為輸入來訓練該網絡生成駕駛路線的軌跡。中級表示不直接使用來自傳感器的原始數據,從而可以將感知任務分解出來,能夠將真實數據和模擬數據相結合,更容易地進行遷移學習。

如下圖所示,輸入表示包括一個自上而下(鳥瞰)環境視圖,其中包括地圖、周圍物體、交通信號燈狀態、車輛過往的運動等信息。該網絡還能夠給出谷歌地圖風格的路線,引導車輛前往目的地。

為駕駛模型渲染輸入和輸出。上排從左至右:路線圖、紅綠燈,限速和路線。下排從左至右:當前智能體框、動態框、過往智能體姿勢,未來智能體姿勢輸出。

ChauffeurNet在每次迭代期間會沿著未來的駕駛軌跡輸出一個點,同時將預測點寫入在下一次迭代期間使用的存儲器中。從這個意義上講,這個RNN并不是傳統式的,因為存儲模型是定制化的。

接著,ChauffeurNet將由十個未來的點組成的軌跡輸出到一個低級控制器,該控制器將這個軌跡轉換為對車輛的控制命令,比如轉向和加速,來驅動汽車。

此外,Waymo還采用了一個單獨的“感知RNN”頭,能夠迭代式地預測環境中其他移動物體的未來軌跡,并且這個網絡與預測車輛駕駛的RNN共享特征。

ChauffeurNet內部分為兩個部分,FeatureNet和AgentRNN。 AgentRNN使用過去智能體姿勢的渲染圖像、由渲染輸入的卷積網絡“FeatureNet”計算出的一組特征、具有最后一個智能體框渲染的圖像,以及具有預測渲染的顯式存儲器,來預測下一個智能體姿勢和自上而下視圖中的下一個智能體框。這些預測用于更新AgentRNN的輸入,以預測下一個時間步長。

未來的一種可能是,車輛可以在選擇自己的駕駛軌跡的同時,更深入地交叉預測其他智能體的反應過程。

模仿學習是“捷徑”還是“普通路徑”?

“行為克隆”也好,“軟件2.0也好”,利用神經網絡編寫代碼來自動駕駛,從而取代人類編寫的代碼,看上去可能是未來全自動駕駛的捷徑之一。

不過,特斯拉“行為克隆”的也有其局限性:這種方法不能教Autopilot系統處理無法輕易預測的危險情景。比如,老司機看到飄在前方的塑料袋時不會轉向,但自動駕駛系統可能就會。

這也是自動駕駛存在的識別訓練數據相關性問題,它不能通過純粹觀察相關性來構建因果模型,并且無法在模擬中主動測試反事實。

另外,傳統方法實現完全自動駕駛系統,需要能夠處理現實世界中發生的長尾事件。

長尾事件的解決需要深度學習訓練盡可能多的數據,但現實情況往往是缺少有效訓練數據。

一位長期從事自動駕駛的業內人士告訴新智元,“行為克隆”是快速收集大量數據的捷徑,但網絡傳輸速度和計算量都太大了。“至于是不是實現無人駕駛的捷徑,要看能不能搞出真正能用的系統。”

馭勢科技CEO吳甘沙告訴新智元,模仿學習的主要局限是數據的可獲得性和有效性,比如影子模式可能解決了可獲得性,但也包括了不值得提倡的司機行為。另一方面,它還是端到端的,在可解釋性上才剛剛有些進展。同時,因為是端到端,比較難在中間過程中接受其他的信息或指令。

吳甘沙認為,模仿學習“肯定是路徑之一,或者是決策的一個來源,但目前來看還不能作為唯一決策方法。”

One more thing: 特斯拉AI芯片專利曝光

據Hot Hardware報道,特斯拉向美國專利商標局提交的專利中提到,傳統處理器可以快速執行單個數學運算,但它有一個限制:這樣的處理器一次只能處理少量數據。

雖然GPU可以使用更大的數據集執行多個任務,但它們最初并不是為機器學習和AI開發的。

特斯拉的AI芯片專利內容如下:

“用于機器學習和人工智能的處理通常需要對大量數據集執行數學運算,并且通常涉及求解多個卷積層和匯集層。”

為了解決這個問題,特斯拉必須開發一種新的神經AI,可以進行“機器學習和人工智能特定的處理操作”。

因此,特斯拉提交了一些專利:

加速的數學引擎

具有可變延遲存儲器訪問的計算陣列微處理器系統

使用非連續數據格式的計算陣列微處理器系統

矢量計算單位。

目前,Autopilot 2.0的計算機組件由英偉達GPU提供支持。

同時,即將推出的升級版本將取代特斯拉目前使用的Autopilot 2.0平臺,使用AI芯片的Autopilot 3.0能夠在汽車中實現全自動駕駛功能。

低速無人駕駛產業綜合服務平臺版權與免責聲明:

凡本網注明[來源:低速無人駕駛產業綜合服務平臺]的所有文字、圖片、音視和視頻文件,版權均為低速無人駕駛產業綜合服務平臺獨家所有。如需轉載請與0755-85260609聯系。任何媒體、網站或個人轉載使用時須注明來源“低速無人駕駛產業綜合服務平臺”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注低速無人駕駛產業聯盟公眾號獲取更多資訊

最新新聞