
而其中最大的技術瓶頸無疑是在感知能力上。除了算法和硬件的支持,訓練數據的質量也起到了決定性的作用——數據量是否足夠大,標注質量是否足夠好,覆蓋的場景是否足夠全等,已經成為了間接衡量一家自動駕駛公司技術好壞的重要標準之一。
百度智能云數據眾包率先推出了針對自動駕駛行業的“私有化標注平臺+基地標注團隊”的AI數據整體解決方案,幫助平臺服務型企業建設完整的數據基礎服務,“上海國際汽車城”就是其中的典型代表。
政策利好,數據和平臺能力也要跟上
近年來,各地方政府持續加大對自動駕駛的基礎設施建設投入,通過政策扶持自動駕駛落地,打造汽車產業生態,提升城市競爭力。
而國際化的汽車之城上海,在自動駕駛上的政策布局早已有所舉措。2018年,《上海市智能網聯汽車道路測試管理辦法(試行)》正式發布,上海就成為了國內自動駕駛公開路測的第一座城市,為上汽、寶馬等企業的自動駕駛實路測試提供重要的基礎建設。2019年,“AI+交通場景計劃”落地上海國際汽車城,旨在打造以上海汽車博覽公園為載體的自動駕駛常態化運營半開放示范區,在基建和測試場景上為產業發展提供支持。
作為全國最早開展智能網聯汽車示范推廣的產業示范區,其規劃從感知和決策層入手,打造硬件、軟件、數據、路測整體解決方案。而這其中決策層是最關鍵但也是最復雜的,算法訓練需要一系列配套建設,包括數據層面的訓練數據和場景庫評測數據,以及軟件層面深度學習數據標注平臺和管理訓練平臺。但由于自動駕駛數據精度高、量級大、標注規則復雜,且軟件平臺具有業務場景適用性特征研發難度高,業內往往會選擇專業的AI數據公司提供數據和平臺服務。
如何基于業務特征提供平臺能力建設,同時保證數據標注質量和安全,實現自動駕駛超智“雙眼”已成為汽車城乃至整個自動駕駛行業的難題。
兼顧數據安全與質量
上海國際汽車城選擇百度智能云數據眾包是最優選。
作為業內專業、高質量的AI數據服務商,2011年起,百度智能云數據眾包即為百度內、外部客戶提供數據服務。尤其在自動駕駛領域,累計成功標注數據上億幀,積累了豐富的行業經驗。據艾瑞咨詢:《2019年中國人工智能基礎數據服務行業研究報告》顯示,百度智能云數據眾包目前已成為國內最大的AI數據服務商。
上海國際汽車城在找到百度智能云數據眾包之后,雙方一拍即合,很快就確立了合作方向:從深度學習數據標注平臺入手搭建軟件能力,并通過平臺和百度標注基地實現數據安全高質標注。“在眾多服務商中,選擇與百度智能云數據眾包合作主要看重百度智能云在這方面的數據經驗和產品技術能力,以及其提供的數據標注安全方案能夠很好的滿足我們的需求。”上海國際汽車城副總工程師李霖如是說。
針對上海國際汽車城需求,百度智能云數據眾包推出了“私有化標注平臺+基地專屬團隊”方案,結合國際汽車城的自動駕駛標注場景和組織管理需求做定制化開發,將百度領先的標注平臺能力抽取并做私有化部署。
其中,百度智能云數據眾包“私有化標注平臺”支持2D、3D、連續幀、融合標注等數十個標注場景,引入了AI預標注和自動質檢算法。經百度上萬項目科學驗證,在標注效率上領先行業20%,并且還具備全面的任務、數據、標注人員管理功能,有效支撐企業做標注管理。同時,由于平臺具有私有化特征,可以實現數據不出庫從而保證數據安全。
數據安全如何保證?在“基地專屬團隊”上,百度與山西政府合建了業內最大的數據標注基地,擁有超過2000名經過多年專業培訓的標注員。基地按照百度數據安全等級規定采取了保密協議簽署、密閉房間作業、實時攝像監控、USB封口等多種嚴格的安全控制措施,從人的源頭上保證數據安全,同時能夠做到高質量和高效率交付。對此,百度智能云數據眾包業務負責人施佳樑介紹:“數據安全一直是我們關注的,也是整個AI行業發展的共同課題,我們從很早開始就在內部建立了嚴苛的安全機制,確保客戶數據安全。”
賦能共建 推動產業升級加速度
目前,雙方關于平臺及數據的合作均已落地。深度學習標注平臺的部署增強了國際汽車城的軟件設施能力,“平臺部署+基地標注”的模式在保證數據安全的同時也極大提升了汽車城的數據處理能力。大量基于自動駕駛場景的高質量數據源源不斷地從百度山西標注基地輸出,并依托汽車城平臺支撐著行業算法的成熟。
同時,百度智能云數據眾包也在不斷對外開放自己的自動駕駛數據采集和標注能力,根據行業需求打造基于數據標注、存儲、管理、訓練、清洗、評測的全套產品能力。并先后與多個地方政府在人工智能數據層面開展深入合作,助力地方產業的轉型升級。
上海國際汽車城擁有國家智能網聯汽車試點示范區及眾多公共實驗室等平臺資源,為自動駕駛企業提供更多學習、交流、研究、測試、數據分析機會。雙方協作互通,持續在產品和生態上創新、賦能行業。毫無疑問,在行業的共同努力下,汽車產業的智能化未來即將到來。