您現(xiàn)在的位置:首頁(yè) > 供需失衡,如何填補(bǔ)自動(dòng)駕駛數(shù)據(jù)標(biāo)注供需鴻溝?
供需失衡,如何填補(bǔ)自動(dòng)駕駛數(shù)據(jù)標(biāo)注供需鴻溝?

2022年,國(guó)內(nèi)自動(dòng)駕駛商業(yè)化進(jìn)程迎來(lái)新的發(fā)展篇章。
相關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,今年一月份,國(guó)內(nèi)新車(chē)前裝標(biāo)配搭載L2級(jí)輔助駕駛系統(tǒng)上險(xiǎn)量為48.45萬(wàn)輛,同比增長(zhǎng)63.21%,前裝搭載率22.13%,同比增長(zhǎng)近10%。
目前,全國(guó)已開(kāi)放道路測(cè)試?yán)锍坛?000公里,發(fā)放測(cè)試牌照900余張。8月1日,《深圳經(jīng)濟(jì)特區(qū)智能網(wǎng)聯(lián)汽車(chē)管理?xiàng)l例》正式生效,深圳作為先行示范區(qū),完全自動(dòng)駕駛汽車(chē)自此可合法上路。
可以說(shuō),自動(dòng)駕駛產(chǎn)業(yè)在商業(yè)化方面交出了一份相當(dāng)不錯(cuò)的答卷,此前預(yù)估的萬(wàn)億產(chǎn)業(yè)規(guī)模正被市場(chǎng)逐步兌現(xiàn)。
而伴隨著汽車(chē)產(chǎn)業(yè)智能化發(fā)展路徑的逐漸明晰,市場(chǎng)需求也在倒逼自動(dòng)駕駛公司進(jìn)一步提升技術(shù)水準(zhǔn)以及為消費(fèi)者提供更優(yōu)質(zhì)的駕駛體驗(yàn),在推進(jìn)L3、L4級(jí)自動(dòng)駕駛技術(shù)落地的路上,仍有眾多問(wèn)題亟待解決。
指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù)需求
自動(dòng)駕駛技術(shù)屬于人工智能的一個(gè)重要分支。
現(xiàn)階段,實(shí)現(xiàn)人工智能主要以機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)方式為主。在實(shí)際應(yīng)用中,無(wú)論是采用有監(jiān)督學(xué)習(xí)模式,亦或是半監(jiān)督學(xué)習(xí)模式,對(duì)標(biāo)注數(shù)據(jù)均有強(qiáng)依賴(lài)性需求。
對(duì)場(chǎng)景積累度與感知能力要求更高的自動(dòng)駕駛技術(shù)對(duì)數(shù)據(jù)的依賴(lài)度也更高。當(dāng)下兩種主流視覺(jué)感知路徑,無(wú)論是特斯拉的毫米波雷達(dá)+攝像頭解決方案,還是Waymo的高精地圖+激光雷達(dá)解決方案,感知算法的訓(xùn)練與調(diào)優(yōu)都離不開(kāi)大規(guī)模的路測(cè)數(shù)據(jù)。
這些路測(cè)數(shù)據(jù)規(guī)模有多大,需要多少才能滿足完全自動(dòng)駕駛的需求,蘭德公司對(duì)此的預(yù)估是,自動(dòng)駕駛汽車(chē)需要在真實(shí)或者虛擬環(huán)境中至少進(jìn)行177億公里的測(cè)試,不斷利用新數(shù)據(jù)調(diào)優(yōu)算法,才能證明自動(dòng)駕駛系統(tǒng)比人類(lèi)駕駛員更可靠。

假設(shè)車(chē)隊(duì)規(guī)模100輛,全年24小時(shí)無(wú)休并以45千米每小時(shí)的速度進(jìn)行測(cè)試,大概需要500年。
500年的時(shí)間顯然過(guò)于漫長(zhǎng)了,最簡(jiǎn)單粗暴的解決方案是擴(kuò)充車(chē)隊(duì)規(guī)模。當(dāng)車(chē)隊(duì)規(guī)模達(dá)到1000輛時(shí),時(shí)間周期可以縮短至50年,而當(dāng)車(chē)隊(duì)規(guī)模擴(kuò)充至10000輛時(shí),只需5年就可以完成所有的路測(cè),并采集到相關(guān)的數(shù)據(jù)。
一個(gè)問(wèn)題,如果有解決方案卻沒(méi)有付諸實(shí)施,則意味著該解決方案是不可行的。當(dāng)下各自動(dòng)駕駛公司在擴(kuò)充車(chē)隊(duì)方面均沒(méi)有過(guò)于激進(jìn),顯然,單純擴(kuò)充車(chē)隊(duì)規(guī)模并不足以解決自動(dòng)駕駛技術(shù)調(diào)優(yōu)問(wèn)題。
問(wèn)題的根源在于如何處理這些路況數(shù)據(jù)。
基于深度學(xué)習(xí)算法的自動(dòng)駕駛技術(shù),繞不過(guò)數(shù)據(jù)的標(biāo)注和訓(xùn)練。采集得到的路況數(shù)據(jù)均為非結(jié)構(gòu)化數(shù)據(jù)集,這些原始數(shù)據(jù)集未經(jīng)處理是無(wú)法直接用于算法的訓(xùn)練與調(diào)優(yōu)。
開(kāi)放路段下的自動(dòng)駕駛汽車(chē)對(duì)于感知系統(tǒng)的實(shí)時(shí)性與安全性要求極高,與之相對(duì)應(yīng),相關(guān)算法的準(zhǔn)確度與場(chǎng)景適應(yīng)度也需要達(dá)到一個(gè)很高的水準(zhǔn),這就對(duì)數(shù)據(jù)標(biāo)注的規(guī)模與數(shù)據(jù)產(chǎn)出質(zhì)量提出了更高的要求。
換言之,自動(dòng)駕駛技術(shù)進(jìn)步帶動(dòng)了規(guī)模龐大的數(shù)據(jù)標(biāo)注需求。但數(shù)據(jù)標(biāo)注行業(yè)量產(chǎn)能力是否跟得上自動(dòng)駕駛行業(yè)快速擴(kuò)充的步伐呢?
答案是沒(méi)有。
線性增長(zhǎng)的數(shù)據(jù)供給
與指數(shù)型增長(zhǎng)的自動(dòng)駕駛數(shù)據(jù)標(biāo)注需求相比,則是線性增長(zhǎng)的數(shù)據(jù)供給。
數(shù)據(jù)標(biāo)注行業(yè)發(fā)展早期,行業(yè)準(zhǔn)入門(mén)檻較低,數(shù)據(jù)處理場(chǎng)景較為簡(jiǎn)單,算法模型尚處于實(shí)驗(yàn)室驗(yàn)證階段,往往簡(jiǎn)單的標(biāo)注工具+少量的數(shù)據(jù)即可滿足需求。
但如此得來(lái)的算法模型過(guò)于基礎(chǔ),最終落實(shí)到真實(shí)場(chǎng)景仍需不停提升算法性能。
目前,提升算法性能的方式主要有兩種,一種是提高算法模型的設(shè)計(jì)復(fù)雜度;另一種則是以數(shù)據(jù)迭代為中心,通過(guò)投喂海量數(shù)據(jù)以提升算法的性能。
從實(shí)踐結(jié)果上來(lái)看,第二種方式更具優(yōu)勢(shì),且被大規(guī)模采用。
提高算法模型的設(shè)計(jì)復(fù)雜度本質(zhì)上依然離不開(kāi)數(shù)據(jù)投喂,且針對(duì)特定場(chǎng)景設(shè)計(jì)算法仍舊需要特定的數(shù)據(jù)。
從算法發(fā)展路徑來(lái)看,通用場(chǎng)景的泛化算法已經(jīng)基本成熟,大多數(shù)新算法是在老算法的基礎(chǔ)上發(fā)展而來(lái)。目前,一些成熟且得到大范圍應(yīng)用的算法模型架構(gòu)在很多年前已經(jīng)基本確定,后續(xù)算法迭代則主要以數(shù)據(jù)為主。
在實(shí)際應(yīng)用去解決問(wèn)題時(shí),不同場(chǎng)景需要解決的問(wèn)題不盡相同。這并不是算法模型的問(wèn)題,而是場(chǎng)景適配度的問(wèn)題。算法架構(gòu)與技術(shù)路徑并無(wú)問(wèn)題,場(chǎng)景不同,需要處理的數(shù)據(jù)也就不同。
以自動(dòng)駕駛場(chǎng)景為例,目前自動(dòng)駕駛感知算法技術(shù)架構(gòu)已經(jīng)基本成熟,封閉場(chǎng)景如礦山、機(jī)場(chǎng)、港口等因場(chǎng)景較為固定且單一,算法迭代基本成熟,因此商業(yè)化發(fā)展之路較為順暢,已進(jìn)入實(shí)質(zhì)商業(yè)化運(yùn)營(yíng)階段。
而開(kāi)放道路下所需要處理的場(chǎng)景過(guò)于復(fù)雜,僅簡(jiǎn)單一個(gè)路口所演化出的場(chǎng)景類(lèi)別就堪稱(chēng)海量,算法模型迭代需要的數(shù)據(jù)量也呈指數(shù)型快速增長(zhǎng)。
但數(shù)據(jù)標(biāo)注行業(yè)長(zhǎng)久以來(lái)粗放的執(zhí)行方式以及依賴(lài)簡(jiǎn)單標(biāo)注工具的業(yè)務(wù)執(zhí)行方式,卻無(wú)法在供給端快速滿足市場(chǎng)的爆發(fā)性需求。
尤其隨著自動(dòng)駕駛3D點(diǎn)云數(shù)據(jù)的應(yīng)用與普及,點(diǎn)云數(shù)據(jù)處理對(duì)數(shù)據(jù)供應(yīng)商的產(chǎn)品力以及交付能力提出了更高的要求,傳統(tǒng)SLG(銷(xiāo)售驅(qū)動(dòng)增長(zhǎng))重銷(xiāo)售輕產(chǎn)品的模式在數(shù)據(jù)標(biāo)注量產(chǎn)能力方面逐漸暴露弊端,數(shù)據(jù)標(biāo)注行業(yè)供給側(cè)與需求側(cè)之間的鴻溝愈發(fā)被拉大。
供需平衡的關(guān)鍵
創(chuàng)新與變革是提升生產(chǎn)力的關(guān)鍵,數(shù)據(jù)標(biāo)注行業(yè)亦然。
數(shù)據(jù)處理難度與處理規(guī)模的提升對(duì)產(chǎn)品力提出了更高的要求,傳統(tǒng)以銷(xiāo)售為核心驅(qū)動(dòng)力的業(yè)務(wù)模式并不能構(gòu)建起深度護(hù)城河,效率提升與成本降低的關(guān)鍵是技術(shù)創(chuàng)新與執(zhí)行方式的變革。
作為行業(yè)領(lǐng)先的數(shù)據(jù)服務(wù)企業(yè),曼孚科技長(zhǎng)期聚焦自動(dòng)駕駛行業(yè),并對(duì)自動(dòng)駕駛數(shù)據(jù)標(biāo)注擁有自己的理解。
相較于SLG模式業(yè)務(wù)增長(zhǎng)需要堆積人力的方式,曼孚科技回歸科技創(chuàng)新本質(zhì),以PLG(產(chǎn)品驅(qū)動(dòng)增長(zhǎng))模式代替SLG模式,重視塑造產(chǎn)品力,構(gòu)建技術(shù)護(hù)城河。
產(chǎn)品方面,曼孚科技推出了第三代數(shù)據(jù)服務(wù)平臺(tái)——MindFlow SEED 數(shù)據(jù)服務(wù)平臺(tái)。相較于傳統(tǒng)標(biāo)注工具,SEED定位平臺(tái)而非工具,原因在于SEED平臺(tái)在解決數(shù)據(jù)標(biāo)注問(wèn)題的同時(shí),也很好地解決了數(shù)據(jù)生命周期管理問(wèn)題。

MindFlow SEED數(shù)據(jù)服務(wù)平臺(tái)
借助AI算法驅(qū)動(dòng)的自動(dòng)標(biāo)注,以及針對(duì)自動(dòng)駕駛場(chǎng)景推出的布爾運(yùn)算、融合點(diǎn)云車(chē)道線、自動(dòng)關(guān)鍵幀等功能,MindFlow SEED 數(shù)據(jù)服務(wù)平臺(tái)在數(shù)據(jù)處理尤其是自動(dòng)駕駛3D點(diǎn)云數(shù)據(jù)處理方面建立了深厚的技術(shù)壁壘,平均標(biāo)注效率提升10倍以上,并在業(yè)內(nèi)維持了較高的技術(shù)領(lǐng)先性。

AI自動(dòng)標(biāo)注
而在數(shù)據(jù)生命周期管理方面,MindFlow SEED數(shù)據(jù)服務(wù)平臺(tái)建立了一整套覆蓋非結(jié)構(gòu)化數(shù)據(jù)接入至結(jié)構(gòu)化數(shù)據(jù)導(dǎo)出的管理機(jī)制,功能涵蓋數(shù)據(jù)集管理、團(tuán)隊(duì)人員管理、工作流管理、數(shù)據(jù)統(tǒng)計(jì)分析等模塊,流程周轉(zhuǎn)更流暢,有效節(jié)約管理成本并顯著提升業(yè)務(wù)執(zhí)行效率。

可視化統(tǒng)計(jì)分析
與傳統(tǒng)依賴(lài)人力的業(yè)務(wù)執(zhí)行方式不同,曼孚科技還更加注重自動(dòng)化建設(shè)。通過(guò)提升RPA(自動(dòng)化)水平,以平臺(tái)產(chǎn)品取代過(guò)往人力堆積的執(zhí)行方式,業(yè)務(wù)執(zhí)行規(guī)模不再與項(xiàng)目經(jīng)理人數(shù)綁定,產(chǎn)能天花板問(wèn)題得以有效突破。
憑借產(chǎn)品與執(zhí)行方式上的創(chuàng)新變革,曼孚科技實(shí)現(xiàn)了自動(dòng)駕駛數(shù)據(jù)標(biāo)注的規(guī)?;慨a(chǎn),從源頭端解決了AI應(yīng)用場(chǎng)景持續(xù)拓展對(duì)于高質(zhì)量多源異構(gòu)數(shù)據(jù)的海量需求。
隨著自動(dòng)駕駛商業(yè)化在更多場(chǎng)景實(shí)現(xiàn)落地應(yīng)用,曼孚科技也將探索更多數(shù)據(jù)生產(chǎn)與處理的新方式,用高質(zhì)量數(shù)據(jù)助力人工智能融合應(yīng)用走深向?qū)崱?/span>

成員中心
- 廈門(mén)星創(chuàng)易聯(lián)科技有限公司
- 青島智騰微電子有限公司
- 巨視慧行(武漢)科技有限公司
- 墨翟科技(上海)有限公司
- 深圳市乾思迪電子科技有限公...
- 廣州市杜格科技有限公司
- 西安海格電氣技術(shù)有限公司
- 深圳市三旺通信股份有限公司
- 深圳市百年星科技有限公司
- 禾純展覽(上海)有限公司
- 華為技術(shù)有限公司
- 上海兆越通訊技術(shù)有限公司
- 廣州美凱信息技術(shù)股份有限公...
- 玖新文化傳媒(上海)有限公...
- 北京銘世博展覽有限公司
- 北京銘世博國(guó)際展覽有限公司
- 恒興國(guó)際會(huì)展(北京)有限公...
- 廣州領(lǐng)拓儀器科技有限公司
- 北京市龍?jiān)磭?guó)際會(huì)展覽有限公...
- 北京市龍?jiān)磭?guó)際會(huì)展有限公司