北京,2023年7月26日/美通社/——全球領先的全息增強現實(AR)技術提供商WiMi全息雲股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布,為了研究基于生成對抗網絡(GAN)的全息圖重建技術,提出了生成對抗性網絡全息重構(GAN-Holo重構)框架。
GAN是深度學習領域的一種無監督學習算法,可以通過在訓練數據中找到特征來生成與輸入數據相似的新數據。
WiMi研究的全息圖重建技術是一種新興的通過生成對抗性網絡來自動進行全息圖重建的技術。GAN可以用于快速生成逼真的3D全息圖,從而提高全息圖的質量和生成效率。
GAN通常由兩個稱為生成器和鑒别器的深度神經網絡組成。生成器以随機噪聲為輸入,經過一系列變換和卷積運算後輸出生成的全息圖,而鑒别器将生成的圖像與真實全息圖進行比較,并向生成器提供準确的反饋,以指導生成器的改進。在不斷優化的過程中,生成器和鑒别器會相互播放和學習,最終生成網絡可以學習得到全息圖的分布,從而生成更逼真的全息圖。
基于GAN的全息圖重建方法的最大優點是它可以處理複雜的全息圖重構問題,例如具有多個深度和反射的物體。同時,該方法還具有良好的魯棒性和對噪聲的适應性,使得即使輸入圖像受到噪聲幹擾,生成的全息圖也能保持高質量。此外,這種方法自動化程度高,可以大大提高全息圖重建的效率。
這種全息圖重建方法的最大優點是可以處理複雜的全息圖重建問題,如多個深度和反射物體。同時,這種方法也很好地适應了噪聲,即使輸入圖像受到幹擾,生成的全息圖也能保持高質量。此外,這種方法自動化程度高,可以大大提高全息圖重建的效率。
WiMi研究的GAN全息重建技術過程主要包括以下幾個部分:
數據集準備。首先需要準備包含大量全息圖的數據集,其中包括原始數據輸入全息圖和全息标記的圖像數據。
網絡架構設計。基于GAN的框架結構由生成器和鑒别器兩個網絡模型組成。生成器網絡用于通過将輸入的噪聲數據映射到全息圖空間來生成全息圖圖像。另一方面,鑒别器網絡用于評估生成器網絡生成的全息圖與真實全息圖之間的相似性,從而指導生成器網絡的改進。
網絡培訓和優化。在訓練過程中,鑒别器網絡和生成器網絡将相互播放和學習,以優化生成器網絡的質量。具體來說,生成器網絡以随機噪聲數據為輸入,通過一系列特征變換和卷積運算生成相應的全息圖。另一方面,鑒别器網絡将生成的全息圖與真實全息圖進行比較,并計算兩者之間的差異。通過不斷優化,生成器網絡最終可以了解全息圖像的分布,從而生成更逼真的全息圖像。
WIMI研究的GAN全息重建模型的訓練過程是可控的,可以通過調整超參數來調整訓練過程,以實現生成全息圖的具體細節,如體素大小、圖像的分辨率等。此外,GAN具有可疊代性的特點,它可以通過不斷的修改和調整來優化生成器和鑒别器的訓練,以實現更高的全息圖生成精度和真實性。GAN的全息圖重建全過程自動化程度高,大大提高了全息圖重建的效率和質量。