北京,2023年10月4日/PRNewswire/–全球領先的全息增強現實(“AR”)技術提供商WiMi全息雲股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布,WiMi正在研究用于圖像數據增強的特征轉換技術,這是圖像數據增強中常用的方法,通過對圖像進行一系列特征變換操作來增加圖像的多樣性和豐富性,從而提高機器學習算法的泛化能力。特征變換可以通過改變圖像的顔色、形狀、紋理等特征來生成新的圖像,從而使模型更好地适應不同的場景和對象。在實際應用中,可以根據具體需要選擇和組合不同的特征轉換技術,以達到最佳效果。
常見的特征變換是圖像旋轉。通過執行圖像旋轉,可以改變圖像的角度和方向,從而增加圖像的多樣性。例如,當訓練目标檢測模型時,可以将圖像随機旋轉一定角度,使模型能夠更好地适應不同角度的目标。另一種常見的特征轉換技術是圖像平移。通過對圖像執行搖攝操作,可以改變圖像的位置和布局,從而增加圖像的多樣性。例如,當訓練圖像分類模型時,可以将圖像随機平移一定距離,使模型能夠更好地适應不同位置的對象。除了旋轉和平移之外,還有許多其他特征變換技術可以用于圖像數據增強,例如縮放、翻轉和剪切。這些技術可以根據具體的應用場景和需要進行選擇和組合,以達到最佳效果。
該技術應用于圖像數據擴充,可以增加數據樣本。例如,通過對原始圖像執行旋轉、翻轉、縮放和平移等特征變換操作,可以生成多個新的圖像樣本,從而擴展訓練數據集的大小,提高模型的泛化能力。通過增加數據的多樣性,模型可以更好地适應各種噪聲和缺失情況。此外,通過組合應用多種特征變換技術,可以進一步提高模型的泛化能力。通過旋轉變換和尺度變換兩種特征變換技術,模型在訓練過程中可以在不同角度和尺度下接觸到更多的圖像,從而提高其對旋轉和尺度變換的适應性,從而提高模型在實際應用中的性能。
WiMi研究的用于圖像數據增強的特征變換技術包括亮度調整、顔色變換、幾何變換、噪聲添加等。亮度調整包括直方圖均衡、對比度拉伸和自适應直方圖均衡,可以使圖像的細節更加清晰,增強圖像的視覺效果。通過改變圖像的顔色空間,可以改變圖像的色彩和色調。顔色轉換包括RGB到灰度轉換、RGB到HSV轉換和RGB到LAB轉換等。這些方法可以使圖像的顔色更加生動,增加圖像的視覺沖擊力。幾何變換是指通過進行平移、旋轉、縮放和翻轉等幾何變換來改變圖像的形狀和結構,使圖像的形狀更加多樣化,增加圖像的視覺可變性。噪聲添加是指在圖像中添加噪聲,以模拟真實場景中的噪聲情況,從而增加圖像的複雜性,使圖像更加逼真,增強圖像的視覺真實性。
通過綜合應用WiMi的上述特征變換技術,可以生成大量的圖像樣本,從而擴展圖像數據集,提高機器學習算法的泛化能力。在實際應用中,我們還可以根據特定任務的需要選擇合适的特征轉換技術,并将其與機器學習算法相結合進行訓練和測試。