當你需要使用大量的計算能力并行地訓練系統,或者讓研究人員花很長時間手工清除壞的系統時,訓練自動駕駛汽車的過程很少是有效的。Waymo正在試驗新的方式:這一方式與指導進化的原理相同。
Waymo與DeepMind合作開發了一種基于人口的訓練方式,用于做行人檢測,該方法擁有最好的神經網絡,就像生命體在自然選擇方面所做的那樣,可以節省時間和精力。
這種方式通常會讓神經網絡進行彼此競爭,較弱的網絡會被較強的“子代”所取代,這些“子代”網絡其實是性能較好的網絡的副本,只不過在參數上進行了調整,就像父母的孩子,有父母的基因,但是又不是父母的克隆體一樣。這樣做的好處是,可以自動清理掉性能較差的網絡,同時不需要從零開始重新訓練。
不過這種方式的風險在于過于注重短期的改進,為了解決這一問題,Waymo創造了一個微型生態環境,在這個生態中,神經網絡在小群體中相互挑戰,以獲得
最好的結果,同時也保持了多樣性,這更適合現實的駕駛環境。
該方法在行人檢測中具有良好的應用前景,基于人口的訓練方式誤報率下降了24%,時間卻較以往縮短了一半,試驗進行的很順利,以至于Waymo開始在其他模型中使用這一方法,這也許能讓自動駕駛汽車更好的應對駕駛環境的復雜性,以避免碰撞。