如果沒(méi)有福特 10 億美元的大手筆投資,剛剛創(chuàng)辦 1 年的 Argo.AI 可能不會(huì)在這么短時(shí)間內(nèi)被行業(yè)熟知,并與 Waymo、Uber、Cruise 等公司并排出現(xiàn)在公眾視野里。不止如此,在將 10 億美元的投資陸續(xù)打入 Argo.AI 戶頭的同時(shí),福特更將其近百位工程師團(tuán)隊(duì)全部投向了 Argo。面對(duì)摩拳擦掌的競(jìng)爭(zhēng)對(duì)手們,某種程度上,可以說(shuō),福特要在 2021 年落地自動(dòng)駕駛打車(chē)服務(wù),寶基本都押在了這個(gè) 200 來(lái)人的團(tuán)隊(duì)上。
Argo.AI 正在研發(fā)的是 L4 的自動(dòng)駕駛技術(shù),和硅谷許多自動(dòng)駕駛明星公司一樣,Argo 的團(tuán)隊(duì)陣容非常強(qiáng)大,CEO Bryan Salesky 最早曾任職于卡耐基梅隆機(jī)器人研究所下屬的國(guó)家機(jī)器人工程中心,之后又在谷歌擔(dān)任自動(dòng)駕駛團(tuán)隊(duì)的硬件研發(fā)主管,聯(lián)合創(chuàng)始人 Peter Rander 則出自 Uber 高級(jí)技術(shù)中心,主導(dǎo)開(kāi)發(fā)了 Uber 第一代自動(dòng)駕駛原型車(chē)。
近日,Bryan Salesky 親自撰文,回憶了從 DARPA 城市挑戰(zhàn)賽至今的自動(dòng)駕駛 10 年歷程,詳細(xì)介紹了自動(dòng)駕駛行業(yè)以及包括 Argo.AI 在內(nèi)的自動(dòng)駕駛公司們面臨的繁重工作,以及身處的困境。雖然已經(jīng)公布了 2021 年落地自動(dòng)駕駛汽車(chē)的時(shí)間表,但 Salesky 對(duì)于自動(dòng)駕駛?cè)嫱茝V開(kāi)來(lái)的時(shí)間預(yù)期卻相當(dāng)保守,因?yàn)樵谒磥?lái),實(shí)現(xiàn)自動(dòng)駕駛遠(yuǎn)比多數(shù)人想象得要復(fù)雜得多,困難得多。
本文由新智駕編譯自 Argo.AI 官方博客 。
10 年前的加州沙漠里,11 個(gè)進(jìn)入決賽的車(chē)隊(duì)在史無(wú)前例的 60 英里比賽中競(jìng)爭(zhēng)。不足 6 小時(shí)里,在不時(shí)有人類(lèi)駕駛汽車(chē)干擾的情況下,機(jī)器人汽車(chē)必須安全快速地完成無(wú)人干預(yù)的駕駛?cè)蝿?wù)。這是 2007 年的 DARPA 城市挑戰(zhàn)賽,這場(chǎng)無(wú)人駕駛比賽無(wú)意中拉開(kāi)了無(wú)人駕駛發(fā)展的序幕。在當(dāng)時(shí),無(wú)人駕駛?cè)员徽J(rèn)為是天方夜譚,而現(xiàn)在回頭看,這場(chǎng)比賽正預(yù)示著一場(chǎng)漫長(zhǎng)旅程的開(kāi)始。通過(guò)小心管控范圍,DARPA 保證了某種程度的成功:參賽者同意了一系列嚴(yán)苛的交通規(guī)則,DARPA 則限制了行人和騎行車(chē)輛,為參賽團(tuán)隊(duì)減輕了一些負(fù)擔(dān)。不過(guò),雖然做了這些簡(jiǎn)化,團(tuán)隊(duì)要完成的任務(wù)依然相當(dāng)艱巨——在 18 個(gè)月里,他們基本是從頭開(kāi)始,開(kāi)發(fā)出了自己的自動(dòng)駕駛系統(tǒng)。
DARPA 挑戰(zhàn)賽顯出了自動(dòng)駕駛對(duì)先進(jìn)的計(jì)算能力和算法的強(qiáng)烈需求。當(dāng)時(shí),我們大部分都依賴于基于特定規(guī)則的編程技術(shù),這意味著,10 年前的機(jī)器人系統(tǒng)更傾向于在限定場(chǎng)景里操作,在特定的道路環(huán)境里,操作者一般不會(huì)偏離既定規(guī)則太多。
Argo 的很多人都在機(jī)器人和自動(dòng)駕駛領(lǐng)域從業(yè)超過(guò) 10 年,我們利用自己深厚的專業(yè)知識(shí)把這項(xiàng)技術(shù)呈現(xiàn)給大眾,其中也包括在 DARPA 城市挑戰(zhàn)賽中的所學(xué)。就在幾個(gè)月前 Argo.AI 的一周年紀(jì)念日上,我們已經(jīng)成為一個(gè)擁有 200 名成員的經(jīng)驗(yàn)充足的團(tuán)隊(duì),并已經(jīng)在匹茲堡和密歇根州東南部進(jìn)行了自動(dòng)駕駛汽車(chē)測(cè)試。
我們面對(duì)的第一個(gè)挑戰(zhàn)是自動(dòng)化智能系統(tǒng)的軟硬件商業(yè)化。在外部環(huán)境中,車(chē)輛、行人混雜,自動(dòng)駕駛沒(méi)有與其共同遵守的一整套規(guī)則,要執(zhí)行起來(lái)非常困難。在夜晚和白天的真實(shí)場(chǎng)景里,惡劣天氣,不同的路形路況,都可能讓情況變得更糟。機(jī)器人系統(tǒng)開(kāi)發(fā)者需要先有一系列簡(jiǎn)化的基本設(shè)想,而環(huán)境的動(dòng)態(tài)性為其帶來(lái)了更多矛盾和變量。
過(guò)去幾年里,部分由于計(jì)算能力的增強(qiáng),這場(chǎng)游戲發(fā)生了很大變化,但也出現(xiàn)了一些復(fù)雜的新問(wèn)題,我們目前仍然沒(méi)有找到解決辦法。計(jì)算機(jī)處理能力、存儲(chǔ)能力和人工智能都進(jìn)步了很多,不需要設(shè)置演示,計(jì)算機(jī)就可以推理出許多問(wèn)題。我們可以進(jìn)行海量的數(shù)據(jù)學(xué)習(xí),以非常高的準(zhǔn)確率識(shí)別圖像,過(guò)濾傳感器中的異常數(shù)據(jù),找到最重要的核心因素。當(dāng)我們擁抱這些變化時(shí),我們也非常清楚,沒(méi)有一個(gè)單個(gè)的工具、技術(shù)、算法能夠解決自動(dòng)駕駛的所有問(wèn)題。下面就是我們對(duì)于自動(dòng)駕駛汽車(chē)的一些思考。
感知世界
傳感器還有很長(zhǎng)的路要走。我們用了激光雷達(dá),它在光照條件差時(shí)也可以較好地工作,理解車(chē)輛周?chē)娜S世界,但不能識(shí)別顏色和質(zhì)地,所以我們又使用了攝像頭。攝像頭在光線微弱的情況下功能非常受限,同時(shí)也很難在各種需要的操作范圍內(nèi)都達(dá)到足夠的聚焦與分辨率。相對(duì)而言,雷達(dá)雖然分辨率較低,但是可以長(zhǎng)距離識(shí)別行人速度。
這就是為什么我們?cè)谲?chē)上裝了這么多傳感器,他們可以實(shí)現(xiàn)優(yōu)劣勢(shì)互補(bǔ)。單個(gè)傳感器不能完全復(fù)制他們捕捉到的東西,計(jì)算機(jī)必須綜合多個(gè)傳感器的數(shù)據(jù),過(guò)濾出錯(cuò)誤的和不一致的。將所有這些整合進(jìn)一個(gè)綜合強(qiáng)大的外部世界圖像里,再進(jìn)行計(jì)算處理,遠(yuǎn)比想象中困難。
開(kāi)發(fā)一個(gè)性價(jià)比高、可維護(hù)的硬件系統(tǒng)挑戰(zhàn)更大。我們盡量以最小的代價(jià)在傳感器軟硬件方面進(jìn)行了創(chuàng)新,減少傳感器計(jì)算,提高識(shí)別范圍和分辨率。但如何達(dá)成這些互相沖突的目標(biāo),讓技術(shù)更可靠地提升,仍然是非常重要的工作。
理解世界
一旦自動(dòng)駕駛汽車(chē)有了“看見(jiàn)”周?chē)澜绲难劬,下一步就取決于車(chē)輛自己了——識(shí)別物體類(lèi)型,前方究竟是行人、騎行者、車(chē)輛,或只是一個(gè)廢棄物,以及物體是以什么樣的速度在移動(dòng)。之后,車(chē)輛還必須判斷物體下一步可能的動(dòng)作。
人工智能、機(jī)器學(xué)習(xí)、計(jì)算能力、云存儲(chǔ)等各個(gè)方面的提升,更新了很多舊的算法,也催生了新的算法。這些新工具在開(kāi)發(fā)新算法方面起了很大作用,它可以篩選出傳感器每秒上傳的數(shù)百萬(wàn)像素的信息,判斷物體位置、尺寸與相對(duì)速度。
我們工作的一部分就是開(kāi)發(fā)算法,通過(guò)傳感器收集數(shù)百萬(wàn)英里的真實(shí)場(chǎng)景數(shù)據(jù),再利用這些數(shù)據(jù)教算法探測(cè)道路上的其它物體,雖然嘈雜和錯(cuò)誤的傳感器數(shù)據(jù)也帶來(lái)了很多困難。工具鏈和運(yùn)營(yíng)團(tuán)隊(duì)進(jìn)行了數(shù)據(jù)流和開(kāi)發(fā)過(guò)程的管理。
我們?cè)缙谌〉玫囊恍┏晒浅柡,我們也非常清楚,最棘手的永遠(yuǎn)是細(xì)節(jié)。
車(chē)輛預(yù)測(cè)
我們開(kāi)車(chē)時(shí),會(huì)下意識(shí)地預(yù)測(cè)接下來(lái)幾秒內(nèi)道路上其它行人、車(chē)輛的反應(yīng),預(yù)想行人或許會(huì)亂穿馬路,車(chē)輛會(huì)突然加塞。細(xì)心的駕駛員都非常善于處理這類(lèi)情況,控制速度,為道路上的異常突發(fā)事件提前做出規(guī)劃。駕駛員所擁有的這種在擁擠城市道路上快速應(yīng)變的能力,自動(dòng)駕駛汽車(chē)同樣應(yīng)該具備。
我們必須開(kāi)發(fā)一種算法,使自動(dòng)駕駛汽車(chē)更深入理解道路參與者可能出現(xiàn)的行為。我們需要向技術(shù)灌輸這種“體貼”意識(shí),保證汽車(chē)安全、可靠、有預(yù)見(jiàn)性地行駛。
例如,車(chē)輛需要知道什么時(shí)候?yàn)榇罂ㄜ?chē)挪出位置,進(jìn)入另一個(gè)司機(jī)的盲區(qū)時(shí)應(yīng)該調(diào)整速度。同時(shí),我們還必須開(kāi)發(fā)出一種算法,讓車(chē)輛知道哪些時(shí)候它過(guò)于保守了,哪些時(shí)候需要在繁忙的交通中“推一下”,或者保持一種狀態(tài),讓其它行人車(chē)輛先做出正確反應(yīng)。計(jì)算機(jī)提取了所有信息,對(duì)它來(lái)說(shuō),不被擾亂學(xué)習(xí)錯(cuò)誤模型非常重要,因?yàn)槿绻A(yù)估了一個(gè)錯(cuò)誤行為,它本身的表現(xiàn)也會(huì)出現(xiàn)異常。
這是我們?cè)诮ㄔ祛A(yù)測(cè)模型時(shí),必須實(shí)現(xiàn)的平衡。這種平衡也只能來(lái)自真實(shí)場(chǎng)景的駕駛案例。在這些案例中,我們可以學(xué)習(xí)預(yù)測(cè)微型演習(xí),后者被證明是衡量道路其它車(chē)輛、行人或物體可能出現(xiàn)的反應(yīng)的最主要指標(biāo)。
系統(tǒng)集成和測(cè)試
驅(qū)動(dòng)自動(dòng)駕駛汽車(chē)的軟件一般被稱為隨機(jī)系統(tǒng),這意味著其結(jié)果取決于用于傳感器隨機(jī)輸入的一系列探測(cè)圖案和模型,而不是連續(xù)的一系列輸入又輸出的數(shù)學(xué)等式。
從同一條路上開(kāi)車(chē)經(jīng)過(guò),你不太可能兩次都準(zhǔn)確地按一個(gè)速度行駛。自動(dòng)駕駛汽車(chē)也是一樣,雖然一般而言,它們的一貫性會(huì)比人類(lèi)駕駛員好一些。
測(cè)試隨機(jī)系統(tǒng)需要大量真實(shí)場(chǎng)景的數(shù)據(jù),這意味著我們必須收集數(shù)百萬(wàn)英里的道路經(jīng)驗(yàn),才能教軟件自信地駕駛。(想象一下一個(gè)人要駕駛數(shù)百萬(wàn)英里才能拿到駕照。)但不是所有里程都是在同等情況下建立的,因此“累積里程數(shù)”并不是一個(gè)具備足夠表現(xiàn)力的追蹤進(jìn)程的衡量標(biāo)準(zhǔn)。再想一下,你在一個(gè)僻靜的小鎮(zhèn)學(xué)習(xí)的駕駛技能,不可能轉(zhuǎn)化成在曼哈頓中心地帶的駕駛技能。
我們的算法通過(guò)復(fù)雜的數(shù)學(xué)與邏輯運(yùn)算,將每秒數(shù)百萬(wàn)的像素轉(zhuǎn)化成自動(dòng)駕駛汽車(chē)所在的世界狀況?紤]到這些高維度輸入,我們就不能用單個(gè)可能的輸入組合進(jìn)行測(cè)試,因?yàn)檫@樣的話,需要測(cè)試的組合數(shù)以萬(wàn)億計(jì),會(huì)非常難辦,所以在使用測(cè)試汽車(chē)的駕駛里程時(shí),我們需要找到更聰明的方式。我們創(chuàng)造了可以抓取正確里程的工具,這些里程充分覆蓋了車(chē)輛可能看到的現(xiàn)實(shí)場(chǎng)景,之后我們?cè)儆眠@些測(cè)試車(chē)輛的正確反應(yīng)。要達(dá)到這種平衡需要在目標(biāo)部署區(qū)域里收集非常大量的駕駛經(jīng)驗(yàn)和數(shù)據(jù),而這個(gè)目標(biāo)部署區(qū)域又必須盡可能覆蓋各種復(fù)雜場(chǎng)景。我們也必須充分考慮各個(gè)場(chǎng)景里可能降低傳感器輸出的環(huán)境變量,例如天氣和光照情況。
我們成立了專門(mén)的物流和測(cè)試團(tuán)隊(duì),可以進(jìn)行安全的自動(dòng)駕駛汽車(chē)測(cè)試,另外我們還有一個(gè)專業(yè)分析和軟件工程師團(tuán)隊(duì),正在開(kāi)發(fā)數(shù)據(jù)流管理工具,這些讓我們?cè)谇榫案采w方面有了更多信心。
要開(kāi)發(fā)出一輛自動(dòng)駕駛汽車(chē),我們今天仍然處于非常早期的階段。那些認(rèn)為自動(dòng)駕駛汽車(chē)在幾年或幾個(gè)月內(nèi)就可以滿大街跑的人,要么是對(duì)眼下的科技發(fā)展水平?jīng)]有充分的認(rèn)識(shí),要么在技術(shù)的安全運(yùn)用上沒(méi)有周全的考慮。對(duì)于我們這些在自動(dòng)駕駛技術(shù)方面已經(jīng)投入很長(zhǎng)時(shí)間的人來(lái)說(shuō),我們想要告訴你的是,這件事情非常困難,整個(gè)系統(tǒng)也非常非常復(fù)雜。
大家都知道,努力、創(chuàng)新、專注的團(tuán)隊(duì)可以解決很多難以想象的棘手問(wèn)題。在 Argo,我們看到了這樣一件激勵(lì)人心的事所帶來(lái)的挑戰(zhàn),也正是這些挑戰(zhàn)驅(qū)動(dòng)著我們利用前面 10 年的積累,邁向一個(gè)自動(dòng)駕駛的全新時(shí)代。
我們正在采取一些較為實(shí)際的方法,在承認(rèn)沒(méi)有“銀色子彈”的同時(shí),充分結(jié)合目前科技的發(fā)展水平。身處這樣一場(chǎng)漫長(zhǎng)的游戲中,我們盡量避免大肆宣傳,而是希望以一種贏得全世界數(shù)百萬(wàn)人信賴的偉大產(chǎn)品的形式,將這項(xiàng)重要技術(shù)帶向成熟。
(責(zé)任編輯:admin)