
在人形機(jī)器人的各項(xiàng)設(shè)計(jì)方案中,3D 視覺(jué)技術(shù)已經(jīng)成為提升環(huán)境感知能力與智能決策水平的關(guān)鍵支撐。憑借對(duì)周?chē)h(huán)境的深度建模、動(dòng)態(tài)目標(biāo)識(shí)別與追蹤,以及對(duì)物體的精準(zhǔn)操作,3D 視覺(jué)大幅增強(qiáng)了人形機(jī)器人在多樣化場(chǎng)景下的安全性與適應(yīng)性。
與其他傳感技術(shù)相比,3D 視覺(jué)傳感器具備高精度、豐富信息量及高度集成等顯著特點(diǎn),有研究指出,機(jī)器人80%的環(huán)境信息獲取依賴(lài)視覺(jué)系統(tǒng)。市場(chǎng)方面,3D 視覺(jué)傳感器在機(jī)器人領(lǐng)域的應(yīng)用前景廣闊,預(yù)計(jì)2025年市場(chǎng)規(guī)模約1.4億元,到2030年有望達(dá)到91.5億元,復(fù)合年增長(zhǎng)率超過(guò)130%。
3D 視覺(jué)主流技術(shù)路線
當(dāng)前,業(yè)界在“如何高效獲取3D信息”和“高效處理3D數(shù)據(jù)”兩大方向下,逐步形成多路徑并行的格局,主要包括:
多目立體視覺(jué)
通過(guò)多臺(tái)相機(jī)模擬人眼視差原理,計(jì)算得出深度圖。該方法結(jié)構(gòu)簡(jiǎn)潔、適合中距離應(yīng)用,但對(duì)計(jì)算資源消耗較大,并且在紋理較弱或低光照條件下精度會(huì)下降。多目視覺(jué)方案目前在不少人形機(jī)器人(如優(yōu)必選Walker X、普渡科技PUDU D9等)中應(yīng)用廣泛。
激光雷達(dá)(LiDAR)
利用激光掃描實(shí)現(xiàn)高精度三維建模,激光SLAM與視覺(jué)SLAM(VSLAM)因傳感器類(lèi)型不同而細(xì)分。多線激光雷達(dá)在空間還原度與形態(tài)識(shí)別上有明顯優(yōu)勢(shì),但整體硬件成本較高,現(xiàn)多見(jiàn)于工業(yè)場(chǎng)景與高端機(jī)器人。
結(jié)構(gòu)光
通過(guò)向物體表面投射已知光紋理,運(yùn)用圖案畸變恢復(fù)三維輪廓,重復(fù)性與精度表現(xiàn)突出,適合0.1~2米內(nèi)的高精度需求,如物體識(shí)別與交互。不過(guò),此技術(shù)易受環(huán)境光干擾,整體體積相對(duì)較大,戶(hù)外應(yīng)用受限。
飛行時(shí)間法(ToF)
以檢測(cè)光脈沖往返時(shí)間來(lái)估算距離,具備較強(qiáng)實(shí)時(shí)性和抗環(huán)境干擾能力,幀率可達(dá)100Hz以上,被小米、波士頓動(dòng)力等廠商采用。ToF隨測(cè)距增長(zhǎng)精度略有衰減,多路徑反射可能影響結(jié)果,其優(yōu)勢(shì)在動(dòng)態(tài)場(chǎng)景與實(shí)時(shí)避障上尤為明顯。
單目視覺(jué)+深度學(xué)習(xí)
采用單相機(jī)結(jié)合深度學(xué)習(xí)估算場(chǎng)景深度,具備極低硬件成本與輕量化優(yōu)勢(shì),常用于教育類(lèi)及成本敏感型機(jī)器人。其精度嚴(yán)重依賴(lài)訓(xùn)練數(shù)據(jù)和模型能力,在無(wú)紋理或大遮擋區(qū)域易出現(xiàn)誤差。
目前,多數(shù)人形機(jī)器人通常結(jié)合不同3D視覺(jué)技術(shù),通過(guò)多傳感器融合實(shí)現(xiàn)精度、成本與可靠性的平衡。例如,將雙目RGB與結(jié)構(gòu)光、ToF與多目視覺(jué)、激光雷達(dá)與單目視覺(jué)等組合應(yīng)用,以應(yīng)對(duì)復(fù)雜場(chǎng)景的多樣需求。
國(guó)內(nèi)3D視覺(jué)產(chǎn)業(yè)鏈及代表廠商
隨著3D視覺(jué)技術(shù)在消費(fèi)電子、生物識(shí)別、機(jī)器人與汽車(chē)等領(lǐng)域的持續(xù)滲透,人形機(jī)器人有望成為又一爆發(fā)性增長(zhǎng)點(diǎn)。據(jù)《人形機(jī)器人產(chǎn)業(yè)研究報(bào)告》,2025年中國(guó)人形機(jī)器人市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)53億元,至2029年有望升至750億元,占全球份額近三分之一,2035年或突破3000億元。
國(guó)內(nèi)已建成較為完整的3D視覺(jué)產(chǎn)業(yè)鏈。上游包括感光芯片及各類(lèi)核心元器件,中游3D感知方案開(kāi)發(fā)商則通過(guò)算法與應(yīng)用定制化組合,下游為各類(lèi)機(jī)器人及智能設(shè)備開(kāi)發(fā)者。代表性企業(yè)如奧比中光、天準(zhǔn)科技、華捷艾米等,均具備較強(qiáng)的研發(fā)能力與行業(yè)影響力:
奧比中光 擁有涵蓋結(jié)構(gòu)光、雙目、iToF、dToF、LiDAR全技術(shù)路線,產(chǎn)品廣泛用于服務(wù)機(jī)器人、工業(yè)測(cè)量、3D支付等領(lǐng)域,在國(guó)內(nèi)服務(wù)機(jī)器人市場(chǎng)3D視覺(jué)傳感器市占率超過(guò)七成,是國(guó)內(nèi)3D視覺(jué)產(chǎn)業(yè)的重要代表。
華捷艾米 聚焦結(jié)構(gòu)光與AI算法與自研芯片的深度融合,形成了適用于消費(fèi)電子、家居、教育等多場(chǎng)景的產(chǎn)品生態(tài)。
天準(zhǔn)科技 主攻工業(yè)視覺(jué)裝備,致力于將精密光學(xué)、AI算法及高端制造相結(jié)合,解決半導(dǎo)體、自動(dòng)化、消費(fèi)電子等行業(yè)痛點(diǎn)。
充實(shí)產(chǎn)業(yè)生態(tài)的還有華??萍?、光鑒科技、深視智能、安思疆科技、馭光科技、靈明光子、禾賽科技、知微傳感、速騰聚創(chuàng)等一批創(chuàng)新公司。
結(jié)語(yǔ)
總體來(lái)看,人形機(jī)器人3D視覺(jué)方案不斷創(chuàng)新,主流技術(shù)各有優(yōu)劣:立體視覺(jué)注重成本與適應(yīng)性,激光雷達(dá)和結(jié)構(gòu)光追求高精度,ToF擅長(zhǎng)動(dòng)態(tài)感知,單目深度更突出性?xún)r(jià)比。當(dāng)前多方案融合已成為提升魯棒性與綜合性能的主流趨勢(shì)。隨著市場(chǎng)的逐步放量,3D視覺(jué)將持續(xù)突破技術(shù)與成本“雙高門(mén)檻”,助力人形機(jī)器人應(yīng)用落地與產(chǎn)業(yè)升級(jí)。