特斯拉的2020年自動駕駛大餐

時間:2019-11-07

來源:中國無人駕駛網

0

導語:2018 年 11 月,國外科技媒體 The Information 曝料,稱特斯拉使用的是名為「模仿學習」(imitation learning)的機器學習技術:

2018 年 11 月,國外科技媒體 The Information 曝料,稱特斯拉使用的是名為「模仿學習」(imitation learning)的機器學習技術:

「與其他自動駕駛公司不同,特斯拉售出的所有車都是數據收割機,即使 Autopilot 處于關閉狀態,車輛傳感器也能照常工作。

特斯拉的2020年自動駕駛大餐

因此,Autopilot 團隊手中有用不完的數據,他們能從中發現人類駕駛員在不同場景下的駕駛方式,并對其進行模仿。

在取其精華,去其糟粕后,這部分信息就成了車輛在特定場景下行駛的輔助附加因素,它們能教會車輛如何轉彎或躲避障礙物。」

The Information 在文中轉述了那些模仿學習「信徒」的理念:特斯拉工程師相信,只要給神經網絡灌入足夠多的駕駛數據,就能讓 Autopilot 學會大多數情況下的轉向、剎車和加速操控。

他們甚至認為,未來連代碼都不用寫了,在特定場景下,自動駕駛系統就知道該怎么做。

這些工程師并不是盲目樂觀,因為他們提出這些觀點幾個月后,谷歌旗下的 DeepMind 就用模仿學習讓 AI 成了《星際爭霸》頂級高手。

而在此前,這款游戲是 AI「修仙」路上的一座高峰。

就連 Google Brain(谷歌 X 實驗室重要項目)機器學習工程師 Alex Irpan 都為此感到吃驚:

「我們一直覺得這種長期任務是模仿學習的死穴,此前我甚至認為它根本玩不轉《星際爭霸》,誰知道結果如此出人意料。我們的擔憂在于,如果 AI 犯了錯,它會發現自己處于沒有人類習慣可模仿的尷尬境地。」

Irpan 推測認為,只要數據量夠了,DeepMind 的 AI 就能成功跨過這個坎:

「如果你的數據集非常大,囊括了不同級別的技巧,比如將所有玩過《星際爭霸》的玩家操作都記錄在內,那么你的數據就足夠讓 AI 學會如何在作出錯誤判斷后成功翻盤了。」

在今年 4 月特斯拉的 Autonomy Day 發布會上,特斯拉 AI 主管 Andrej Karpathy 親口證實了模仿學習的存在。

事實上,他還透露稱,模仿學習已經在一定程度上用到了量產版的 Autopilot 上。

Karpathy 還堅信,當下靠手工編碼的任務,未來靠模仿學習會更加出色。

顯然,如果一切順利,特斯拉也能像 DeepMind 一樣在自動駕駛行業橫掃一切。

更重要的是,業內根本沒有什么競爭對手。

因為除了特斯拉,誰也沒有 60 萬輛在路上勤勞采集數據的車輛,而這些車輛每天在各種路況下能累積 2000 萬英里的行駛里程。

即使強如 Waymo,手上也沒有如此體量的數據集,因為 Waymo 的測試車保有量只有特斯拉車隊的 0.1%。

雖然能采集數據的車輛眾多,但想從這些隨機上傳的數據中找到有用的部分并不容易。因此,特斯拉需要找到捕捉各種不同駕駛習慣的新方式。

對大多數公司來說,手動采集是最直接的方式。

特斯拉工程師可以在系統中植入上傳觸發器,只要某些數據符合要求,就會自動保存并上傳,比如無保護左轉。

他們也確實這么做了:當車輛的視覺神經網絡探測到了交通信號燈,或駕駛員向左打了方向盤,車輛就會記錄下這個片段,隨后通過 Wi-Fi 回傳。

不過,那些工程師們想不到的行為怎么辦?如果神經網絡犯了錯誤怎么辦?

在這樣的情況下,Autopilot 的介入是最理想的觸發器。Musk 表示,特斯拉的方法是「將這一切看作錯誤的輸入」。

如果 Autopilot 的介入被視為錯誤,那么隨后人類駕駛員的動作就是正確行為最好的示范。

這樣一來,Autopilot 的介入就能持續提供有用的訓練數據了。

當然,在駕駛員操作模式下我們也能采集訓練數據。為此,特斯拉專門設計了一個「影子模式」。

The Information 在文章中對其進行了一番描述:

業內也有不少評價,認為特斯拉所謂「影子模式」對新 Autopilot 軟件的開發價值不大,畢竟特斯拉本來就能在不影響車輛行駛的情況下運行各種測試軟件。

Autopilot 的工程師完全可以拿測試軟件的表現與車輛實際表現進行對比。在「影子模式」下,Autopilot 團隊則能對人類與 Autopilot 在相同場景下的反應進行對比。

用模仿學習訓練的神經網絡可以在車載計算機上被動運行,同時輸出它眼中的最佳選擇。如果人類駕駛員有不同反應,就能觸發這個片段的數據上傳。

一旦出現「意見相左」,神經網絡的抉擇就會被判錯,而駕駛員的操作則成為正確示范。

除了在人與計算機意見相左時保存數據,特斯拉還能在神經網絡「懷疑」自己時保存數據。

當下,市場上已經有了不少試圖量化神經網絡不確定性的技術,當這個數值超過某個閥值,就會觸發數據的保存和上傳。

因此,從廣義上來講,特斯拉共有三種采集有價值數據的方法:

鑒于特斯拉的硬盤每天都能接收 2000 萬英里數據,因此想采集大型數據集(包括不同的駕駛習慣和糾錯示范)并不難。

特斯拉的2020年自動駕駛大餐

截止今年 10 月,特斯拉 Autopilot 行駛里程為 18.8 億英里來源:https://lexfridman.com/tesla-autopilot-miles-and-vehicles/

不過,對 Waymo 這樣兩年才跑 2000 萬英里的公司來說,這種方案不太實際了。

如果 DeepMind 手上只有數百個玩家的數據,它的 AI 還能制霸《星際爭霸》嗎?

恐怕沒有希望。

這并不是小看他們,現實是當下的神經網絡對數據的胃口實在是太大了。

對人來說,一個小時內學會玩《星際爭霸》并非難事,但想在同樣時間內訓練出同樣水平的神經網絡,就得有數百萬甚至上億個千變萬化的例子打基礎。

同樣的,即使神經網絡能從龐大的駕駛數據中學到一些駕駛的精髓,想與人類媲美也得將錯誤率拉低到 0.1% 以下。

鑒于邊際效益會隨著數據的增多而遞減,因此,只有真正海量的數據庫才能解決問題。

不過,海量的數據庫不是我們想搭就能搭起來的。舉例來說,如果我們想要 1 萬個極端情況的示例,前提是得累計 100 億英里的行駛里程。

對特斯拉來說,是有希望實現的。因為隨著新車的持續交付,未來 17 個月就能搞定 100 億英里。

而 Waymo 現在的車隊規模,實現這一目標得 800 年。

這就是特斯拉的自動駕駛解決之道:

對那些無法人工編碼的駕駛任務進行模仿學習,配合計算視覺與行為預測的深度學習,以及那個無所不包的海量數據集。

Musk 相信,特斯拉將在 2020 年底解決全自動駕駛問題。不過,業界普遍認為 Musk 定的時間點有些激進。

在他們看來,自動駕駛技術的開發是人工處理的過程。

按照這種理解,開發自動駕駛軟件需要工程師不斷對代碼進行修改,因此人的速度就是天花板,即使添加更多工程師也快不了多少。

但現在還是這種思路嗎?

DeepMind 為了攻克《星際爭霸》,花了三年時間研究。不過,用上了模仿學習后,將 AI 訓練到人類級別只用了三天。

為什么能這么快?

因為訓練流程已經能自己寫出《星際爭霸》的對戰代碼,而前三年人類的工作主要是為了標定這個訓練流程,特別是神經網絡架構和數據集。

火箭工程師們走的也是這個路子,火箭前期的設計與建造會花費他們大量時間,幾年之內甚至一點成功都見不到。

不過,當萬事俱備,十秒鐘的倒計時后就能見證奇跡。從時間的維度看,前幾年毫無作為,最后幾秒突然爆發。

事實上,研究和工程的進展都被隱藏在了幕后。

顯然,現在的特斯拉正在通過一系列工作搭建自己的訓練流程。

舉例來說,特斯拉全新的計算硬件還沒火力全開,為新硬件設計的神經網絡也還在開發與測試中,他們正在為未來積聚力量。

至于今年 4 月展示的那版全自動駕駛軟件,據說只是三個月神經網絡訓練的結果,軟件開發對應的場景也相當單一。

而就在一年之前,特斯拉才剛剛掌握高速上的車道保持功能,當時特斯拉還推了一個 OTA 升級包修復了車輛在車道線間反復搖擺的漏洞。

Karpathy 指出,那次的升級,特斯拉「重寫了很多東西」。從那時起,Karpathy 的團隊和 Autopilot 部門的其他技術專家們一直在為 Autopilot 打地基,特別是計算視覺。

如果特斯拉不推送升級包,公眾就看不到他們努力的結果。

至于一些城市駕駛功能是否適合部署,則純粹是二進制而非增量問題,最終一切都得由特斯拉來決斷,外部是根本看不到其中的漸進發展過程的。

全自動駕駛汽車,不但能徹底顛覆 Uber、滴滴、Lyft 與傳統出租車公司苦心建造的王朝,還能讓傳統的私人擁車制分崩離析。

美國汽車協會的數據顯示,購買并使用一輛新車,每英里平均要花掉 0.62 美元。而投資機構 ARK 預計,自動駕駛出租車的生產與運營成本僅為 0.26 美元/英里。

如果套用 ARK 的經濟模型:

「只要自動駕駛出租車公司將價格定在 0.45 美元/英里,比小型轎車稍低(擁車成本為 0.47 美元/英里),那么自動駕駛出租車每英里依然能盈利 0.19 美元。

假設一輛車每年運營 12.7 萬英里(幾乎是當下傳統出租車運營里程的 1.8 倍),每英里收費 0.45 美元,一年利潤就有 2.62 萬美元。

如果有 100 萬輛這樣的自動駕駛出租車,就意味著能每年凈賺 262 億美元。」

但別被 100 萬輛車嚇住了,這個數量級的出租車根本不夠用:

假設用戶的出行需求維持在當下的水平,每輛自動駕駛出租車就能代替 8-9 輛常規汽車(平均每年行駛 1.35 萬英里)。鑒于全球常規乘用車保有量約為 10 億輛,因此自動駕駛出租車必須有 1.1 億-1.25 億輛才夠用。

所以,自動駕駛行業的成長空間還很大。

不過,ARK 投資的模型中有些假設需要進行調整。

比如它將自動駕駛出租車的造價定在了 5 萬美元一輛,這可比現在最便宜的 Model 3(3.9 萬美元)要貴上不少。

即使 Model 3 毛利只有 5%,也能從造價中再減掉 2000 美元。對特斯拉 Network 來說,這才是更合理的數字。

對自動駕駛出租車年運營里程的假設,它應該和 Uber 與傳統出租車差不多,即一年 7 萬英里。

需要注意的是,即使是自動駕駛汽車,也會有空駛時間。

按 Uber 的水平看,車上有乘客的時間占到車輛運營總時間的 64%。

也就是說,每年單輛車凈利潤 4200 美元才更合理,100 萬輛自動駕駛出租車則能凈賺 42 億美元。

當然,毛利與價格是緊密掛鉤的,而 0.45 美元/英里的定價已經相當低廉。如前所述,私家乘用車平均每英里要的價格是 0.62 美元。

如果打車費用定在 0.6 美元/英里,相同的特斯拉車型每年能凈賺 1.08 萬美元。

無論怎么計算,自動駕駛出租車都會成為成本大殺器:

另外,我們還得關注車輛壽命。

一輛傳統燃油車,20 萬英里后的維保成本會迅速攀高。電動車在這方面有優勢,比如當下特斯拉電池組使用 50 萬英里沒有問題。

這也就意味著,普通用戶得駕駛 37 年才能耗盡特斯拉電池組的壽命。而 100 萬英里使用壽命的特斯拉新車也正在開發中。

簡言之,自動駕駛出租車能解鎖電動車潛在的有形資產:電動車的電池組壽命不會輕易被浪費。

不過,自動駕駛出租車和電動汽車之間的協同作用在最初可能并不明顯。在這樣的情況下,只要延長車輛壽命周期,才能轉化為相當可觀的經濟價值。

如果電池和電動機的提升和改進,能為電動車增加 20 萬英里的壽命,在經濟上就相當于讓一輛車變兩輛車。

這對汽車廠商來說,少賣車等于是革了他們的命。從消費者角度考慮,一輛車開上 30 年恐怕也會是一個噩夢,畢竟在這么長時間的跨度里,汽車在各項功能上都會有脫胎換骨的提升。

但對自動駕駛汽車來說,這根本不是問題。這也是華爾街巨鱷們(麥肯錫、瑞銀、摩根斯坦利等)普遍長期看好自動駕駛出租車的原因,其市場規模將達數千億甚至上萬億美元。

如果自動駕駛汽車真能如約部署,不但會讓司機們丟了飯碗,還會逐步吞掉整個汽車行業。

不過,即使到了現在,也有人懷疑這項技術的可行性:特別是近期和中期深度學習能否與人類的視覺、行為預測和駕駛能力所匹敵。

這個問題目前誰也回答不了,但我們依然能從這個趨勢中看出一些端倪:

首先,如果深度學習能在近期和中期解決這些問題,特斯拉將成為自動駕駛技術的正名人。

其次,如果特斯拉實現了全自動駕駛,從外人的眼光來看,特斯拉像開了外掛一樣,佛擋殺佛。

總之,特斯拉在自動駕駛上的新「套路」讓我們重新認識了技術進步。

前期的緩慢開發并不意味著后續的拖沓,一個花費數年時間搭建的神經網絡可能在幾天內就能完成訓練。而自動駕駛,有可能僅需一個 OTA 的時間,就如期而至了。


低速無人駕駛產業綜合服務平臺版權與免責聲明:

凡本網注明[來源:低速無人駕駛產業綜合服務平臺]的所有文字、圖片、音視和視頻文件,版權均為低速無人駕駛產業綜合服務平臺獨家所有。如需轉載請與0755-85260609聯系。任何媒體、網站或個人轉載使用時須注明來源“低速無人駕駛產業綜合服務平臺”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注低速無人駕駛產業聯盟公眾號獲取更多資訊

最新新聞