時間在變,空間随着時間也在變,不變的唯有真知灼見。
2025年01月16日  星期四
首頁
财經
觀察
參考
ESG
公告
市場
研究
IPO
周報
動态
推薦
首頁 > 公司

WiMi在基于CNN的圖像特征提取算法上工作,挖掘圖像數據的價值

來源:真灼傳媒 時間:2023-03-20 16:02:15

字号

                       

北京2023年3月17日電 /美通社/ -- 全球領先的全息圖增強現實("AR")技術提供商WiMi全息雲公司(納斯達克股票代碼:WIMI)("WiMi "或 "公司")今天宣布将CNN(卷積神經網絡)應用于圖像特征提取并開發了基于CNN的圖像特征提取算法。


CNN是一種重要的深度學習方法,可以解決許多複雜的模式識别問題,并被廣泛用于圖像識别、語音識别和自然語言處理。


WiMi的算法利用卷積神經網絡的局部連通性和分權特性,在圖像處理過程中通過與其他許多卷積核參數的訓練,自動提取同一圖像的不同圖像特征。池化操作可以大大減少訓練參數的數量,方便特征圖的大小,簡化網絡模型,提高訓練效率。


卷積神經網絡由兩個交替的卷積層和池化層組成。卷積層負責從輸入中提取特征,而池化層則負責整合特征。卷積層從圖像中獲得局部信息,池化層顯著降低參數幅度,全連接層輸出預期結果。


首先,初始特征由卷積層提取。卷積層類似于一個過濾器,用于從圖像中提取特定的初始特征。經過大量的訓練,機器會自動調整卷積核的值,然後與圖像矩陣進行卷積,從圖像中提取特定的特征。卷積核的數量大大影響了初始特征的提取,但時間消耗也相應增加。然後由池化層提取主要成分。池化層的主要作用是減少訓練參數的數量,降低卷積層輸出的特征向量的維度,減少過拟合,隻保留最有幫助的圖像信息,并減少噪聲的傳播。在圖像處理問題中,池化層可以降低特征圖的維度,并為圖像特征引入空間不變性,包括拉伸、旋轉和翻譯。


卷積層和池化層共同工作,提取圖像特征,并大大減少原始圖像引入的參數。最後,該系統應用全連接層來生成一個與所需類别數量相等的分類器。權重矩陣被相乘,偏移值被添加,并使用激活函數和梯度下降法對參數進行優化。全連接層用于線性分類。換句話說,它是對檢索到的高級特征向量進行線性組合,然後再用于生成最終的預測結果。


卷積核對整個圖像進行水平、垂直和對角線掃描以生成特征圖。當圖像被處理時,輸出圖像中的每個像素都使用一個受限的接受域,這意味着輸入圖像中的每個像素隻使用輸入圖像的一小部分。通過逐漸擴大每個連續卷積層的感受野,可以獲得圖像中更精細、更抽象的信息,經過幾個卷積層,最終得到不同大小的圖像的抽象表示。


如果計算機能夠像人類一樣理解圖像,它就可以完成許多人類根本無法完成的任務。讓計算機理解數字圖像是當前計算機科學研究的一個關鍵主題。對計算機來說,數字圖像隻是一個數字矩陣,所以需要特征提取算法來幫助計算機理解圖像。


WiMi基于卷積神經網絡的圖像特征提取算法具有圖像處理的平移和尺度不變性,可以提高圖像特征提取的準确性。這對于進一步完成圖像識别和圖像分類至關重要。基于卷積神經網絡的圖像特征提取技術已被廣泛應用于醫療、安防、自動駕駛等領域。未來,WiMi将繼續擴大其圖像特征提取算法的應用。 使用www.DeepL.com/Translator翻譯(免費版)


關于WIMI全息雲


WIMI全息雲公司(NASDAQ:WIMI)于2015年開始商業運營,是一家全息雲綜合技術解決方案提供商,專注于全息AR汽車HUD軟件、3D全息脈沖LiDAR、頭戴式光場全息設備、全息半導體、全息雲軟件、全息汽車導航等專業領域。其服務和全息AR技術包括全息AR汽車應用、3D全息脈沖LiDAR技術、全息視覺半導體技術、全息軟件開發、全息AR廣告技術、全息AR娛樂技術、全息ARSDK支付、互動全息通信等全息AR技術。


微信掃碼 > 右上角點擊 > 分享