版權聲明:此文源自廠家供稿,如需轉載請尊重版權并保留出處。內容若存有質量疑問請立即與本網聯系,商用車之家將盡快處理并予以回應。
——歡迎到訪! 專業商用車網絡媒體 為您服務!
作為世界第一大商用車市場,中國商用車市場正處于轉型升級的關鍵時期。近年來,無論是相關政策法規的出臺,還是技術、方案的革新,商用車行業的發展始終圍繞著保障安全和提高效率的核心主題。
10月28日,元橡科技CTO任杰出席商用車安全大講堂線上交流會,從綜合立體視覺解決方案價值亮點及未來啟發的角度,分享和探討高性價比商用車智駕系統研發量產實踐。(以下為部分交流內容整理。)
關于商用車的安全與效率,我們在關注什么?
相比于乘用車而言,商用車既作為一種交通運輸工具,也是我們日常經濟活動中重要的生產資料。提高商用車的安全與效率,具體來說,我們可以延展出一些關鍵詞,比如“節能環保”、“物流與交通設計”、“智慧城市”……以及我們重點關注的“智能駕駛主動安全”這一領域。
在商用車的營運過程中,普遍存在的一些隱患和問題包括:
l 司機易疲勞駕駛,工作環境惡劣
l 容易造成司機盲區,產生安全事故
l 商用車質量慣性大,提速慢,司機駕駛習慣勻速,節省油耗
l 急剎車對商用車司機造成嚴重安全傷害
l ……
而現有的商用車智能駕駛系統仍存在著較大的“漏報”和“誤報”的局限性。“漏報”也就是近來常常見諸報端的一些事故,比如撞上前方側翻車輛等;“誤報”則是感知系統會把一些不存在或沒有風險的目標錯誤地識別,例如把地面上的一些畫、幻影當成是真正的行人,從而產生了不必要的規避。
在漏報和誤報之間取得均衡,提升整個智能駕駛系統的上限,是業內孜孜不倦追求的一個目標,因為人類社會駕駛場景里面還存在太多的長尾效應,太多目前常規的系統還不能克服的一些困難。
漏報(撞上前方側翻車輛)丨來自互聯網公開資料
誤報(道路平面上的虛假行人)丨來自互聯網公開資料
從場景規模和難度上我們把智能駕駛系統分成幾大層次:
i. 其一就是規模小一點、難度也低一點的封閉場景,比如港口、礦區無人駕駛;
ii. 再往前,我們現在有很多物流企業,包括乘用車也已經在推進高速場景的NOA等等,當然,這種智能駕駛系統里也都存在著上述所提到的一些局限性;
iii. 而到最后,我們真正希望推動的是在人類社會生活中更主要的一些場景,比如城市道路上,是不是能夠有更好的系統去輔助人類司機,替代人類去完成一些艱苦的工作。這就要求系統具備強大的理解場景的能力和細節把握的能力,要求系統感知的信息足夠稠密和高效。
這是智能駕駛發展和演進的趨勢,而為了更好地解決當前智能駕駛的局限,面向未來更高階的智能駕駛發展趨勢,元橡科技始終專注推動“綜合立體視覺”解決方案。
為什么是綜合立體視覺解決方案?
雙目立體視覺是人眼仿生學,它基于三角測量原理,通過視差和距離之間的反比關系,對周圍環境能得到一個三維的感知。而我們提出的“綜合立體視覺”的概念,在雙目相機感知傳感器的基礎上,還要配合大腦中樞,把立體視覺和AI充分結合起來,去達到一種高效能的感知和處理能力。
元橡科技雙目立體視覺的特點:低成本&高性能
l 深度圖與RGB圖天然對齊
l 立體信息可識別對象,降低對樣本量和硬件算力要求
l 全類型對象檢測,降低長尾效應風險
l 局部可見障礙物、模糊目標均能測量
l 百米檢測誤差小于5%,不依賴地面
l 拓展性強,如限高、限寬、地形檢測
l 圖像分辨率提高,小目標識別性能倍增,算力基本增加不大
和目前大家比較熟知的一些傳感器(激光雷達、4D毫米波等)對比,元橡雙目相機的立體視覺成像所包含信息的豐富程度是非常高的,我們常說一圖勝千言,這是雙目相機非常擅長并且應該發揮作用的地方,而從精準度上來講,雙目立體視覺測距性能已經非常快速地逼近激光雷達的性能。
高性價比的優勢,決定了雙目立體視覺系統成為實現商用車安全與效率平衡的可行性方案。
元橡自研的Deep Fusion架構很大程度上提高了系統魯棒性和安全閉環保障。Deep Fusion框架融合視差和AI能力,可以實現目標類型的“N+1”,真正做到全類型障礙物檢測,大大降低長尾效應的影響。
Deep Fusion特點:
l 有效結合圖像與視差信息,準確描述障礙物3D屬性
l 較低的算力需求下實現更遠的檢測能力
l 全類型障礙物的檢出能力
l 提升融合毫米波能力:融合需要的目標空間位置和類別屬性同時具備
其中“N+1”目標類型,“N”指車輛、行人、自行車、交通標識等指定多類型檢測目標,通常用AI語義處理分析,而“1”則是指一些通用障礙物,比如樹叢、柵欄,以及路面施工鐵板等不知道什么時候出現的未知類型。對于這些,我們人類有很好的感知和避障能力,但目前的很多系統,尤其是單目系統,就很難去很好地識別。
元橡綜合立體視覺解決方案
所以這也就是我們為什么希望給業界推薦綜合立體視覺解決方案,因為我們看到了在這些方面上,我們提出的“N+1”完備目標檢測新范式具有更好的泛化性、通用性,可以應用到更多的實際場景。比如商用車的限高,車身較高的商用車在通過一些橋梁、山區涵洞的時候如果發生刮蹭,帶來的經濟損失是非常大的,通過雙目相機可以去做高度可通過性的檢測,相類似的還有通過狹窄通道時的限寬預警等。立體視覺技術在諸如此類的場景需求上已經有了一些很好的應用,落地之后也得到了比較好的反饋。通過提前給到司機輔助性的信息和警告,可以有效避免一些刮蹭事故和經濟損失。
高性價比商用智能駕駛的未來啟發
首先,目前在乘用車上有兩方面很強烈的趨勢,一是高分辨率,二是大角度周身環繞。我們認為,未來在乘用車先行的技術帶動下,商用車也會往這個趨勢去應用和發展。
目前可能1M、2M的分辨率是主流,后期分辨率會變得越來越高。現在乘用車有很多新的旗艦車型開始上8M的前視,甚至是周視的設備,在周視環繞感知的傳感器方案里,視覺是起到非常大的作用的。如果我們把車看成是泛機器人,有了比較好的感知傳感器,它就有了很好的視野、觸覺等感官,這樣它就可以更智能地去做一些決策和判斷,來更安全、快速、高效地完成運輸任務。
而從今年特斯拉的AI Day展示的Tesla Occupancy Networks看,它基于車身一圈的傳感器,通過占有網格的神經網絡和大量的數據訓練而得到一種相對比較直觀的視覺效果。其實類似的這種三維感知的能力元橡很早之前也就能做到了,我們并不需要那么多復雜的傳感器陣列,只是通過簡單的雙目立體視覺,同時也不需要那么大量的數據積累和數據閉環訓練、標注維護。在三維環境感知方面,立體視覺的空間表達更精細,顆粒度更細,精準度也更好,這也是立體視覺高性價比和高性能的體現。
Tesla Occupancy Networks丨來自互聯網公開資料
元橡高性價比的“Occupancy grid map”空間表達
高分辨率視覺傳感器、大角度視場角(FOV)以及周身環繞感知能力將成為未來商用車智能駕駛系統的重中之重,是我們對于未來工作的展望和啟發。
總體來講,對于商用車發展的思考,我們始終認為是“安全第一”,在保障社會運轉和人身安全的基礎之上,再去提高運輸效率,通過科技賦能,輔助司機改善工作環境,減輕勞動強度,規避分心和盲區等因素導致的安全隱患。元橡科技將致力于綜合立體視覺解決方案,從更好的感知出發,實現更好的決策,更好的執行,最終得到更好的安全和效率。