
該團隊實施模仿學(xué)習,即從演示中學(xué)習。駕駛員駕駛一輛配備三個攝像頭的汽車,從車輛前方和兩側(cè)觀察周圍的環(huán)境。然后,通過神經(jīng)網(wǎng)絡(luò)(基于大腦神經(jīng)元如何交互處理信息的計算機系統(tǒng))處理這些數(shù)據(jù)。此種方法使得車輛能夠根據(jù)觀察人類做出類似決策,并根據(jù)從中所學(xué)來做出決策。迪肯大學(xué)副校長Saeid Nahavandi解釋說,“該過程期望僅從攝像頭拍攝的圖像生成一個模型,以用于自動駕駛汽車。”
該處理系統(tǒng)具體來說是一個卷積神經(jīng)網(wǎng)絡(luò),反映在大腦的視覺皮層上。該網(wǎng)絡(luò)有一個輸入層、一個輸出層和兩者之間的若干處理層。輸入過程將視覺信息轉(zhuǎn)換成點。隨后,隨著更多的視覺信息輸入,這些點被不斷地被比較。通過減少視覺信息,該網(wǎng)絡(luò)可以快速處理環(huán)境中的變化。例如,前方出現(xiàn)移動的點可能意味著道路上出現(xiàn)了障礙。結(jié)合通過觀察人類操作員所獲得的知識,這意味著該算法知道道路上突然的障礙物應(yīng)觸發(fā)車輛完全停止,以避免發(fā)生事故。Nahavandi表示,“擁有可靠且強大的視覺是自動駕駛汽車的強制性要求,而卷積神經(jīng)網(wǎng)絡(luò)是圖像處理應(yīng)用中最成功的深度神經(jīng)網(wǎng)絡(luò)之一。”
不過,Nahavandi也指出了一些不足之處。一是雖然模仿學(xué)習加快了訓(xùn)練過程,但是同時減少了創(chuàng)建優(yōu)良模型所需的訓(xùn)練數(shù)據(jù)量。相比之下,卷積神經(jīng)網(wǎng)絡(luò)需要大量的訓(xùn)練數(shù)據(jù)來找到最優(yōu)的卷積層和濾波器配置,而這有助于組織數(shù)據(jù),并生成合適的模型。
Nahavandi還表示,“我們發(fā)現(xiàn)增加濾波器的數(shù)量并不一定會產(chǎn)生更好的性能。網(wǎng)絡(luò)和訓(xùn)練流程參數(shù)的最優(yōu)選擇仍然是一個未解決的問題,全球研究人員都在積極研究。”接下來,研究人員計劃研究更智能、更高效的技術(shù),包括遺傳和進化算法,以獲得最佳參數(shù)集,從而更好地打造自我學(xué)習、自動駕駛的汽車。