現在有幾十家公司,例如傳統廠商,大型科技公司和初創公司都在用各種各樣的方式探索自動駕駛汽車技術。顯然,這些公司和方法不可能都成功;但我們可以從中學習和探索:在自動駕駛領域,會不會出現贏家通吃的局面,哪些廠商或路徑有機會達到。在這個行業是否也存在網絡效應,是像互聯網行業一樣,有一兩家巨頭成為最后的贏家,還是會有五到十家公司進行慘烈的競爭?

自動駕駛領域,玩家眾多,成分復雜。
這些問題很重要,因為搞清楚它們,就有可能知道未來汽車行業的趨勢和格局。未來的景象是巨型的汽車主機廠像購買ABS模塊一樣從供應商中購買成熟的自動駕駛系統,還是會有一個自動駕駛廠商或新造車廠商像微軟和英特爾(它們改變了PC行業的格局)一樣改變汽車行業的格局?
自動駕駛技術的設備商們有優勢么?
首先,用于自動駕駛的硬件和傳感器(也包括汽車電子的傳感器)將成為可替代性較強的商品。就像當初的LCD屏幕一樣,它們可能還需要很多科學和工程方面的改進才能成熟,但一旦成熟之后,卻不具有不可替代性,它們可能會擁有很強的規模效應,卻沒有網絡效應。例如,現在激光雷達的成本可能是5萬美元,當它未來的成本降到幾百美元時,某一個頭部制造商可能成為細分市場的贏家,但因為沒有網絡效應,它對于整個格局不會產生影響。就像Sony雖然制造了最好的圖像傳感器(它是蘋果和很多頭部手機廠商的供應商),但這并不能幫助Sony的智能手機業務變得像蘋果一樣強。

3D激光雷達成像
另一方面,自動駕駛領域可能不會像PC或智能手機那樣出現一個具有統治力的第三方軟件開發者生態系統。Windows壓倒了封閉的Mac,Android打敗了Windows Phone,這是因為他們提供了一個平臺來供開發人員開發自己的應用,并形成一個良性循環。而這個循環在自動駕駛系統中可能不會存在,因為你不會因為某一個軟件來購買汽車,而是會有一個綜合的購買決策。
對于自動駕駛軟件系統,它會在整個城市范圍內進行優化和路線選擇,這意味著我們應該將所有具有自動駕駛能力的汽車當成一個整體,而不僅僅是一輛自動駕駛汽車,或一個“自動駕駛出租車”車隊。網約車模式毫無疑問具有網絡效應,但是隨著自動駕駛技術的加入,它將變得更加復雜(自動駕駛技術可能會使網約車的乘車成本降低四分之三或更多)。自動駕駛網約車車隊將動態地預先定位他們的汽車,并且這些車以及可能的其他所有汽車都將實時協調其路線,以實現最大效率(也許跨車隊),從而避免所有車都在同一時間選擇同一條最優路線,進而產生沖突。
從技術角度來看,這三個層次(駕駛,自動的路線選擇和優化以及按需用車分配)在很大程度上是獨立的。Uber可以使用通用汽車的自動駕駛汽車,而這款汽車可能用的是Waymo的自動駕駛技術。但顯然有一些廠商希望將這些層次的技術捆綁在一起發揮作用,例如特斯拉就計劃把整車、自動駕駛和網約車業務都吃掉;而Uber則不會要求你只使用它自己開發的自動駕駛系統。但是,盡管微軟利用Office和Windows的捆綁,形成了網絡效應并成為了PC時代的贏家,但一個小型OEM商堅持要求你使用它的自動出租車服務,就像蘋果在1995年堅持要求你購買Apple Works而不是Microsoft Office 。我懷疑可能會有更中立的方法,如果我們對所有車輛進行跨城市協調,甚至在交叉路口處進行車輛與車輛之間的通信(這種情況應該是存在的),那么可能會需要某種公共層(盡管我始終認為是去中心化系統更好)。但是這些預見畢竟只是猜測,就像你在1900年預測現在的交通擁堵情況一樣。
地圖和行駛數據將產生網絡效應
我們可以討論自動駕駛領域的關鍵網絡效應會在哪里產生。這可能會與硬件,傳感器和軟件有一定關聯;但更與一些重要的數據有關。對于自動駕駛,有兩種數據很重要:地圖和行駛的數據。

首先是地圖。人類的大腦在不知不覺中會不間斷的實時處理傳感器(眼睛、耳朵、皮膚觸覺)數據并建立我們周圍世界的3D模型;這樣,當我們穿越森林時,就不會被樹根絆倒或將頭撞在樹枝上。在自動駕駛中,這被稱為SLAM(同步定位和地圖繪制)—我們繪制周圍環境的地圖并在其中定位自己。顯然,這是自動駕駛的基本要求:汽車需要利用各種傳感器搞清楚它在路上的位置以及周圍有什么特征(直道,彎道,路肩,交通信號燈等),并且還需要弄清楚其他車輛與它的相對位置以及行車速度。
在真實道路上實時執行這種操作仍然非常困難。人類可以用視覺和聲音定位,但是僅從成像(尤其是2D成像)中提取周圍環境的數據并生成足夠精確的3D模型仍然是一個尚未解決的問題:機器學習可以提高這種可能性,但是現階段仍然沒有足夠的能力實時的做到高精度的自動駕駛。這就是為什么幾乎所有的自動駕駛項目都將成像與360度激光雷達結合在一起:每個傳感器都有其局限性,但是通過將它們結合起來(“傳感器融合”),你可以獲得完整的圖像。在未來的某個時候,有可能僅憑成像就能建立你周圍的世界模型,但是使用更多的傳感器可以更快地到達那里,雖然需要等待這些傳感器的成本和尺寸在未來達到使用的需求。
如果激光雷達是達到SLAM的一種捷徑,那么另一個更有可行性的是使用預建地圖。你可以預先測量所有道路(不需要實時的處理所有數據,建立道路模型),然后將完整的地圖安裝在任何自動駕駛汽車上。有了高精度地圖,自動駕駛汽車就不必在高速行駛的同時還要實時處理所有數據并識別各種彎道、交通信號燈或各種預期外的雜物;而是可以在高清3D模型上發現關鍵地標并快速將自身定位在道路上。因此,自動駕駛汽車可以使用攝像頭和激光雷達,并將它們感知到的圖像與預先構建的高精度地圖進行比對,而不必從頭開始,從而能夠讓定位的速度和精度都有提升。
地圖具有網絡效應。當任何自動駕駛汽車沿著預先設計的道路行駛時,它既會將道路與地圖進行比較,又會更新地圖數據:每一臺自動駕駛汽車都同時可以是一輛測試汽車。如果你已售出500,000輛自動駕駛汽車,而其他人僅售出10,000輛,則你的地圖將更新得更頻繁,并變得更準確,因此你的自動駕駛汽車將更少遇到全新的,出乎意料的路況和意外。你售出的汽車越多,它們的自動駕駛性能就越好—這正好符合網絡效應的定義。
從長遠來看,這里的風險是,就像自動駕駛汽車可以在沒有激光雷達的情況下做到SLAM一樣,它也可以在沒有使用高精度地圖的情況下做到SLAM—畢竟,人類也可以這樣做。目前尚不清楚不使用高精度地圖在未來是否會成為主流,但目前看來,已經有不少具有自動駕駛功能的汽車被銷售,也有很多自動駕駛測試車輛在路上跑。
地圖是數據中的第一個具有網絡效應的,而下一個是自動駕駛汽車在了解周圍環境后的行為數據。在一個空曠的道路上行駛,或者在一個全是自動駕駛汽車的封閉道路上行駛是現在自動駕駛汽車的主要場景,但是弄清真實道路上其他駕駛員將要做什么以及如何做是則完全是另一個問題。
機器學習是自動駕駛進行突破的重要動力:機器學習不使用復雜的規則來解釋人、汽車、道路的行動方式,而是使用數據(數據當然越多越好)。你收集的有關真實駕駛員在現實世界中的行為和反應方式的數據越多(可以通過測試車或學習特斯拉),你的自動駕駛系統軟件就能更好地理解周圍的情況,并且更聰明的規劃和反應汽車下一步該做什么。就像地圖一樣,在發售前,你的測試車們會盡可能多的收集這類數據,發售后,你售出的每一輛車都會將這些數據收集并返回。因此,就像地圖一樣,你售出的汽車越多,汽車的自動駕駛系統就越強,這也就能達到網絡效應。
在對自動駕駛系統的模擬訓練中,行駛數據還能帶來其它的優勢。例如如果要解決以下問題:“如果發生X,我們的自動駕駛系統軟件將如何反應?”,解決的方法之一是專門派一輛自動駕駛測試車,整天在城市附近的道路行駛,以查看它對碰巧發生的這種事件作何反應。但問題在于,這不是受控試驗,這些隨機的情況在現實中發生的概率是非常低的,所以測試的效率也會很低。因此更好的方式是,利用仿真軟件對各種各樣的情況進行試驗,例如你可以反復測試“激光雷達會檢測到那輛卡車嗎?”這樣的情景,而你也可以將測試的數據和情況與真實的路況數據進行比對。
因此,存在間接的網絡效應:你擁有的真實路況的駕駛數據越多,你的仿真模擬就越準確,你的自動駕駛系統軟件就越強大。仿真還具有明顯的規模優勢,當你擁有更強的算力,更多的工程人員,尤其是有經驗的工程人員,那么你的系統也會越強。例如,加入Google顯然為Waymo帶來了優勢:據報道,加入Google前,Waymo每周可行駛25,000個“真實”的自動駕駛里程,而加入Google后,則平均每周可以測試1900萬英里。
所以,可以說特斯拉在地圖和駕駛數據方面均處于領先地位:自2016年底以來,特斯拉在量產車上搭載了自動駕駛組件,這包括八個攝像頭(它們提供了近360度的視野),以及前向雷達和超聲波傳感器。這些傳感器都可以收集駕駛員真實的行為數據,并將其發送回特斯拉。問題在于,由于只有前向雷達,特斯拉建立世界模型的數據大部分來自攝像頭的成像。但就如前文所說,這樣的數據組成的世界模型,有其局限性。顯然,特斯拉在走一條與依靠激光雷達的自動駕駛廠商們不同的道路;它將賭注都下在了計算機視覺的開發速度上,而不再等待未來可能出現的廉價/實用的激光雷達。而這同時意味著,計算機視覺軟件將不得不解決更難的問題,因此帶來了更大的挑戰,成熟的時間也會更慢一些。如果未來激光雷達在較短的時間內成熟(更小,更便宜),而特斯拉主要基于計算機視覺的自動駕駛系統不能在同一時間段擁有相應的性能,那么它在前期積累的優勢可能被消弭,結果如何,我們拭目以待。
誰將掌握數據,數據越多越好么?
因此,能夠產生贏家通吃效應的網絡效應,體現在:行駛數據和地圖中。這帶來兩個問題:誰來獲取數據,以及你需要多少數據?
數據的所有權是一個有趣的權力和價值鏈問題。很明顯,特斯拉計劃自己構建所有重要的自動駕駛技術部分,并將其安裝在自己的汽車上,所以它擁有完整的數據。而一些OEM廠商認為,因為他們的汽車和客戶的關系,所以他們自己應該擁有的數據和其分配權,而不是給任何技術合作伙伴的。我不確定銷售GPU、攝像頭或激光雷達這些“商品”的廠商是否希望保留數據;但那些開發成套自動駕駛系統的公司需要擁有數據,因為這就是它的工作方式。如果它們不能把數據投入到系統中去,它的技術就無法得到改進。這意味著OEM為供應商創造了網絡價值,而自己卻沒有得到任何價值,除了更好的自動駕駛性能。這就是PC或安卓OEM廠商的處境:他們通過同意在產品中使用軟件來創造網絡效應,這使得他們的產品得以暢銷,但他們的產品已經近乎變成了商品(可替代性強),網絡價值歸科技公司所有。這是一個循環,大部分價值都歸廠商,而不是OEM。當然這也是大多數汽車OEM廠商想自己做自動駕駛技術的原因:他們不想落得像康柏電腦那樣的下場。
這讓我想到最后一個問題:你到底需要多少數據?隨著你添加更多的數據,系統會無限制的變得越來越好,還是說有一個S曲線—是否有一個點,達到這個點之后,添加更多的數據會有遞減的回報?
那就是—網絡效應有多強?
對于地圖來說,這是一個很明顯的問題。你需要多大密度的布置測試車輛,用多高的頻率測量和更新數據,地圖的數據精度才足夠高。每一個參與者最低的市場份額是多少,整個市場給了參與者多少空間?最后這個市場是會有十家公司,還是只剩得下一兩家。是否可以有一群二線OEM廠商,將它們所有的地圖數據集中和整合起來?這個生態不像是消費軟件生態系統—RIM和諾基亞不能把黑莓和S60用戶群集中起來,但你可以把地圖集中起來。這是一個進入的障礙還是一個進入的條件?
這個問題也適用于行駛數據,事實上是適用于所有的機器學習項目:隨著你添加更多的數據,收益會越來越少,曲線在什么時候會變平,有多少人可以得到這么多的數據?對于一些互聯網應用,比如搜索,數據帶來的改進似乎確實是無限的,它的結果總是能變得更相關。但對于自動駕駛,從準確度來說,似乎確實應該有一個上限—如果一輛自動駕駛汽車可以在意大利那不勒斯很好的運行一整年,那它應該也能在其他地方運行,那么還有多少需要改進的地方?在某些時候,你實際上就可以說它具有了足夠好的能力。所以,網絡效應意味著,如果你有更多的用戶,你的產品就會變得更好,但在產品停止明顯改善之前,你需要多少用戶?你需要賣出多少輛具有自動駕駛系統的汽車,你的自動駕駛的能力才會和市場上最好的汽車一樣好?有多少公司有能力達到這種水平?而與此同時,機器學習本身也在快速變化,能幫助你的系統達到完全自動駕駛能力的數據量或許是在變少的。
成為普通供應商還是Waymo/特斯拉一家獨大?
前文一直在說更好的自動駕駛,那么“更差”的自動駕駛技術意味著什么?它是意味著乘客有可能死亡,還是僅僅代表汽車在面對復雜路況時行駛起來不太順暢;需要人類駕駛員來接管?
我猜測,隨著未來自動駕駛從Level 4進化到Level 5,手動控制的比例會越來越少。Level 5的自動駕駛不會一下普及,而是會階段性的被使用,而隨著它的普及,手動干預的比例會越來越少,直到最終被隱藏或移除。Level 5自動駕駛的普及也會和各國的法律有關,也許在莫斯科或那不勒斯使用Level5之前,法律更友好的德國會率先使用。這將意味著數據在網絡規模上被收集,并在完全自主之前就被使用。
我們現在還不好確定所有這些問題的答案;很少有業內人士估計Level 5的自動駕駛在5年內會實現,大家都傾向于這個時間會是10年后。他們有一些假設,這些假設對于未來的汽車行業將產生巨大的不同影響。有一種極端的假設是,因為沒有建立較強的網絡效應,最后出現5-10家擁有可行自動駕駛系統的公司,在這種情況下,汽車行業將把自動駕駛作為一個組件購買,價格就像今天的ABS、安全氣囊或衛星導航一樣。這仍然會給行業帶來變化,自動駕駛的普及會讓網約車行業的乘車成本至少下降四分之三,這將使許多人重新考慮是否應該買自己的車。而與自動駕駛技術同步進行的電動汽車技術,則使汽車中的運動部件數量減少非常多,這會改變工程動力、供應商和電池制造商的進入壁壘。但是行業里不會出現手機行業里Android那樣的玩家。在另一個極端假設,Waymo或特斯拉那樣的廠商會因為強網絡效應成為贏家,而整個行業的面貌將與現在大不相同。