恭喜成都艾特能電氣科技有限責任公司許軼博獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜成都艾特能電氣科技有限責任公司申請的專利一種基于梯度平衡的多類別模型訓練方法、介質及設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN112633359B 。
龍圖騰網通過國家知識產權局官網在2025-05-06發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202011509570.5,技術領域涉及:G06F18/214;該發明授權一種基于梯度平衡的多類別模型訓練方法、介質及設備是由許軼博;潘澤文;范宏偉;李佳斌設計研發完成,并于2020-12-18向國家知識產權局提交的專利申請。
本一種基于梯度平衡的多類別模型訓練方法、介質及設備在說明書摘要公布了:本發明提供了一種基于梯度平衡的多類別模型訓練方法、介質及設備,其中模型訓練方法包括通過將訓練樣本數據輸入到選定的神經網絡模型進行訓練獲得損失函數;統計訓練模型時損失函數的梯度分布;根據分布結果分配樣本權重;權重的平滑處理;權重的衰減處理;獲取新梯度更新網絡模型;本發明通過在訓練的過程中根據輸入訓練樣本數據得到的損失函數梯度的分布,調整樣本分配的權重,平衡不同程度難易樣本對模型的影響,縮短了模型訓練時間同時提升了模型的精度。
本發明授權一種基于梯度平衡的多類別模型訓練方法、介質及設備在權利要求書中公布了:1.一種基于梯度平衡的多類別模型訓練方法,其特征在于,方法包括如下步驟:S1:獲取OpenImage數據集作為訓練樣本,將訓練樣本數據輸入到選定的神經網絡模型進行訓練獲得損失函數;S2:統計訓練模型時損失函數的梯度分布;通過前向傳播的方式訓練構建好的網絡模型,計算損失函數,并對損失函數的梯度進行統計;具體步驟如下:S201:訓練數據集輸入后計算出損失函數并求導,輸入樣本導數的絕對值取值范圍為[0,U],其中U是樣本導數絕對值取值范圍的上邊界,將導數絕對值取值范圍平均分割為m段,即分為的區間段;S202:每一批次輸入的訓練數據樣本會得到對應的導數,對每個類別單獨統計導數分布,根據各個區間的導數數量,建立大小為m×n的分布矩陣K進行統計,每輸入一匹訓練數據樣本到模型中,更新分布矩陣K;S3:分配樣本權重;根據獲得的梯度分布統計結果,對每個樣本分配相應的權重,對于類別k,其分布為:a1k,a2k,…,amk其中aik表示類別k導數在第i個區間內的數量;根據類別k的分布計算出類別k在權重矩陣W中的行向量為:[w1k,w2k,…,wmk]其中wik表示所述類別k在對應i的權重,所述wik的計算公式如下:wik=a1k+a2k+…+amkaik×mS4:權重的平滑;對獲得的樣本對應的權重進行平滑處理,縮小過大的權重;S5:平滑后權重的衰減處理;在訓練過程中對平滑項進行衰減,使得訓練結束后平滑項衰減到0,平滑項Si的衰減公式為:Si=0.5-0.5×iZ其中Z為模型訓練是設定的總訓練步數;S6:獲取新梯度更新網絡模型;將經過平滑和衰減處理的權重矩陣與原損失函數梯度相乘獲得新的梯度,并通過反向傳播更新網絡模型的參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人成都艾特能電氣科技有限責任公司,其通訊地址為:610000 四川省成都市高新區天辰路88號1棟6層1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。