北京,2023年4月13日/美通社/——全球領先的全息增強現實(AR)技術提供商WiMi全息雲股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布開發基于多視圖特征融合的3D物體識别系統。該系統使用卷積神經網絡來分析3D對象的不同視點,并融合來自多個視點的特征,以推斷關于3D對象的全局信息,這些信息被饋送到全連接網絡中,用于從多個視點分類和推斷3D對象的标簽。
WiMi基于多視角特征融合的三維物體識别系統由三個主要部分組成:視點信息選擇、特征提取和特征融合。
視點信息模塊可以從多個視點将3D對象投影到2D平面中。不同的視點涉及不同的對象方向和結構信息。可以在多個視圖之間構建圖結構,并基于空間分布将其聚類為組。合理的視點信息選擇策略可以優化網絡的訓練數據。
特征提取模塊是使用卷積神經網絡來提取特征。在卷積層之後,特征映射模塊可以作用于視圖特征響應圖。使用多層感知機學習多個映射矩陣,并且多個矩陣将相應的視圖映射到近似特征空間上。映射矩陣可以概括視圖之間的視點變換關系,并将特征圖映射到描述區域的組級特征。
特征融合模塊側重于以合理有效的策略融合多個特征,以實現基于聚類的多層融合。卷積運算對高維視圖特征進行加權,并對不同視圖之間的權重信息進行編碼。CNN處理具有空間數據的特征響應圖。在使用最大值池化以獲得特征圖上的最大響應之後,從CNN的卷積層提取特征。該系統學習相鄰視圖之間的相關性,以生成更具解釋力的全局特征,并将其融合到特征圖中。
将所有視圖特征融合為全局特征後,系統将全局特征輸入到全連通層,利用空間信息挖掘融合特征中的高維特征,完成分類和輸出結果。
三維物體識别技術是計算機視覺的核心技術之一,也是理解三維場景的關鍵技術。WiMi将繼續擴展其基于多視圖特征融合的3D對象識别算法的應用。
關于WIMI全息雲
WIMI全息雲公司(NASDAQ:WIMI)是一家全息雲綜合技術解決方案提供商,專注于包括全息AR汽車HUD軟件、3D全息脈沖激光雷達、頭戴式光場全息設備、全息半導體、全息雲軟件、全息汽車導航等專業領域。其服務和全息AR技術包括全息AR汽車應用、3D全息脈沖激光雷達技術、全息視覺半導體技術、全息軟件開發、全息AR廣告技術、全息AR娛樂技術、全息ARSDK支付、交互式全息通信和其他全息AR技術。