恭喜中國科學院計算技術研究所李廣力獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜中國科學院計算技術研究所申請的專利一種面向神經網絡模型壓縮的加速方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115018049B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210587507.6,技術領域涉及:G06N3/0464;該發明授權一種面向神經網絡模型壓縮的加速方法及系統是由李廣力;馬秀;王雪瑩設計研發完成,并于2022-05-25向國家知識產權局提交的專利申請。
本一種面向神經網絡模型壓縮的加速方法及系統在說明書摘要公布了:本發明提出一種面向神經網絡模型壓縮的加速方法和系統,其在模型壓縮過程中使用掩碼感知的卷積計算方式可以加速模型的前饋傳播。掩碼感知的卷積計算方式利用掩碼信息,動態地轉換濾波器的權重參數,展開輸入張量,以及恢復輸出張量。在模型壓縮的反向傳播中,利用掩碼感知的方式,對卷積層的輸入張量的梯度的計算進行加速,利用掩碼信息,動態地轉換濾波器的權重參數和輸出張量的梯度。
本發明授權一種面向神經網絡模型壓縮的加速方法及系統在權利要求書中公布了:1.一種面向神經網絡模型壓縮的加速方法,其特征在于,包括:步驟1、獲取訓練數據集訓練周期epochmax、剪枝率神經網絡模型的權重參數L是神經網絡模型中卷積層的個數;步驟2、遍歷該神經網絡模型的卷積層,對卷積層的濾波器的權重參數的重要性進行排序,并根據排序結果,在掩碼中將前個最不重要的濾波器的權重參數對應的元素值置0,其中Kl為中濾波器的個數;步驟3、遍歷所有卷積層,執行與的逐元素相乘步驟4、基于和訓練數據集通過掩碼感知的卷積計算方式計算神經網絡模型的的輸出;步驟5、根據該輸出和訓練數據集的標簽,得到該神經網絡模型的損失函數;步驟6、基于掩碼信息,利用掩碼感知的卷積計算方式,計算損失函數對輸入張量和權重參數的梯度;步驟7、使用該梯度更新權重參數步驟8、將步驟2-7執行epochmax個周期后,移除當前神經網絡模型中標記為零的權重參數,得到壓縮模型;其中該步驟4中掩碼感知的卷積計算方式包括:步驟41、根據神經網絡模型中第l層的掩碼信息和第l–1層的掩碼信息有序組織該權重參數中有效濾波器的權重參數,得到該權重參數對應的K′l×C′l·Rl·Sl的稠密矩陣K′l表示有效的濾波器的個數,C′l表示每個濾波器中有效的通道的個數,Rl表示濾波器的高,Sl表示濾波器的寬;步驟42、基于圖像到矩陣算法,通過掩碼識別輸入張量的有效通道進行展開,隨著卷積核在輸入張量的有效通道上移動,將有效通道上元素向量化為矩陣的一列,得到輸入張量的稠密矩陣形狀為C′l·Rl·Sl×Hl+1·Wl+1;步驟43、執行矩陣乘法得到一個K′l×Hl+1·Wl+1的輸出矩陣步驟44、利用掩碼對進行逆展開操作,將輸出矩陣恢復為原始的卷積的輸出張量該步驟6中掩碼感知的卷積計算方式包括:步驟61、利用掩碼和對中的有效權重參數重新排列,跳過無效的權重參數,得到一個K′l×C′l·Rl·Sl的稠密矩陣步驟62、利用掩碼對神經網絡模型中第l層卷積層的輸出張量的梯度進行轉換,將其有效的通道有序地重新排列,同時跳過無效的通道,獲得K′l×Hl+1·Wl+1的稠密矩陣步驟63、執行矩陣乘法得到一個C′l·Rl·Sl×Hl+1·Wl+1的輸出矩陣步驟64、針對輸出矩陣基于矩陣到圖像算法,根據掩碼只對有效的通道進行轉換,將映射到的Cl×Hl×Wl的數據布局上;該神經網絡模型為圖片分類模型,該訓練數據集包括多張圖片,該標簽為圖片對應的類別,該步驟8包括將待分類圖片輸入至該壓縮模型,得到該待分類圖片的類別。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國科學院計算技術研究所,其通訊地址為:100080 北京市海淀區中關村科學院南路6號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。