北京,2023年6月12日/美通社/——全球領先的全息增強現實(AR)技術提供商WiMi全息雲股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布,它正在開發一種基于生成對抗網絡(GAN)的多模式信息融合檢測算法。多模式信息融合檢測算法是一種通過使用GAN融合來自不同傳感器或模态的數據來提高檢測精度和魯棒性的方法。它是通過訓練兩個神經網絡來實現的,一個生成器和一個鑒别器,其中生成器負責生成虛假數據樣本,鑒别器負責區分準确和不準确的數據。這兩個網絡相互競争學習,直到生成器能夠産生足夠真實的數據,而鑒别器無法區分真僞。
在多模式信息融合檢測中,可以融合和處理來自不同傳感器或模态的數據,如圖像、聲音和文本,以獲得更全面、準确的檢測結果。生成器使用局部細節特征和全局語義特征來提取源圖像的細節和語義信息。在鑒别器中加入感知損失,使融合圖像的數據分布與源圖像一緻,提高了融合圖像的準确性。融合後的特征進入興趣池網絡進行粗分類,生成的候選幀被映射到特征圖上,最後,全連接層完成目标分類和定位。
GANs在圖像生成方面具有固有優勢,允許無監督拟合和近似精确的數據分布。将生成器和鑒别器用于對抗目的允許融合圖像保留更豐富的信息,并且端到端網絡結構不再需要手動設計融合規則。
WiMi研究的基于GANs的多模式信息融合檢測算法的技術流程包括數據預處理、GANs模型訓練、模型測試、結果評估以及優化和改進。來自不同傳感器或模态(如圖像、聲音和文本)的數據被融合以進行融合處理,從而提高目标檢測的準确性和穩健性。此外,端到端訓練的GANs在融合後可以增強多模式信息特征之間的互補性和冗餘性,以提高基于融合元素的目标檢測和分類的準确性。
多模式信息融合檢測算法将整個圖像融合過程視為生成器和鑒别器之間的對抗性過程。對于每種模态,可以分别訓練生成器和鑒别器。然後,通過組合多個模态的生成結果,可以獲得更準确、更全面的檢測結果。
基于GANs的多模态信息融合檢測算法是近年來快速發展的研究方向之一。許多相關研究已被應用于不同的領域,如智能監控、語音識别、醫學圖像分析、工業檢測等。
未來,WiMi将進一步探索如何融合更多的傳感器和模态,以提高融合效果和适用範圍。與此同時,WiMi将研究如何采用更高效的GAN結構,并通過更有效的訓練方法提高模型性能。此外,WiMi還考慮将該技術與深度學習相結合,以進一步提高檢測的準确性和穩健性。總之,基于GANs的多模态信息融合檢測算法具有許多應用前景,是一個值得關注和深入研究的研究方向。
關于WIMI全息雲
WIMI全息雲公司(NASDAQ:WIMI)是一家全息雲綜合技術解決方案提供商,專注于包括全息AR汽車HUD軟件、3D全息脈沖激光雷達、頭戴式光場全息設備、全息半導體、全息雲軟件、全息汽車導航等專業領域。其服務和全息AR技術包括全息AR汽車應用、3D全息脈沖激光雷達技術、全息視覺半導體技術、全息軟件開發、全息AR廣告技術、全息AR娛樂技術、全息ARSDK支付、交互式全息通信等全息AR技術。