時間在變,空間随着時間也在變,不變的唯有真知灼見。
2025年01月23日  星期四
首頁
财經
觀察
參考
ESG
公告
市場
研究
IPO
周報
動态
推薦
首頁 > 公司

WiMi(WiMi.US)将緻力于基于多通道CNN的3D對象檢測算法

來源:真灼傳媒 時間:2023-04-17 16:48:21

字号

北京,2023年4月14日/美通社/——全球領先的全息增強現實(AR)技術提供商WiMi全息雲股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布,其研發團隊正在研究基于多通道卷積神經網絡的3D物體檢測算法。它使用RGB、深度和BEV圖像作為網絡的輸入,分别回歸對象的類别、3D大小和空間位置。該算法結合了多通道神經網絡系統來實現三維目标檢測。


BEV圖像提供垂直于相機視點的信息,并且可以表示對象的空間分布。BEV圖像使用點雲投影生成,并用作神經網絡輸入,以提高3D對象檢測精度。通過CNN直接處理輸入的點雲數據,可以解決無序點雲的編碼和特征提取問題,獲得3D邊界盒的端到端回歸。該算法僅從單眼圖像中提取3D建議幀,并估計3D邊界框,然後将激光點雲與視覺信息相結合,并将點雲投影到BEV圖像中。該算法将信息饋送到CNN中,并融合多條信息以估計3D邊界框。多個信息的融合有助于更好地檢測3D空間中的對象。


WiMi的3D物體檢測算法可以同時識别物體的類别、空間位置和3D尺寸,極大地提高了物體檢測的準确性和效率。多通道物體檢測神經網絡系統允許3D物體檢測,将輸入擴展到RGB、深度和BEV圖像。首先,使用RGB圖像、深度圖像和BEV圖像作為網絡輸入,然後通過CNN獲得特征圖。使用空間金字塔池化層生成特征圖中所提出區域的特征向量,然後使用分類器和回歸器實現對象的分類和位置回歸。分類器主要用于确定提案中提取的特征屬于哪一類。最後,将通過兩個完全連接的層進行多任務回歸,以預測對象類和3D邊界框。


三維物體檢測和識别一直是計算機視覺中的關鍵技術。它是機器理解和與外部世界互動的基礎。三維物體檢測技術可廣泛應用于導航、智能機器人、無人駕駛汽車和安全監控等領域。


随着三維數據采集技術的進步、計算能力的增強、深度學習以及應用需求的增加,三維視覺技術的研究和應用越來越受到重視。WiMi的算法在自動駕駛、智能機器人、ARVR、遙感、生物醫學等領域具有廣闊的應用前景。


關于WIMI全息雲


WIMI全息雲公司(NASDAQ:WIMI)是一家全息雲綜合技術解決方案提供商,專注于包括全息AR汽車HUD軟件、3D全息脈沖激光雷達、頭戴式光場全息設備、全息半導體、全息雲軟件、全息汽車導航等專業領域。其服務和全息AR技術包括全息AR汽車應用、3D全息脈沖激光雷達技術、全息視覺半導體技術、全息軟件開發、全息AR廣告技術、全息AR娛樂技術、全息ARSDK支付、交互式全息通信和其他全息AR技術。





微信掃碼 > 右上角點擊 > 分享