恭喜無錫江南計算技術研究所黃則強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜無錫江南計算技術研究所申請的專利一種面向異構眾核平臺的Im2col加速方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114219065B 。
龍圖騰網通過國家知識產權局官網在2025-06-10發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202110349448.4,技術領域涉及:G06N3/0464;該發明授權一種面向異構眾核平臺的Im2col加速方法是由黃則強;劉沙;劉鑫;陳德訓;彭超;高捷;王宜鵬設計研發完成,并于2021-03-31向國家知識產權局提交的專利申請。
本一種面向異構眾核平臺的Im2col加速方法在說明書摘要公布了:本發明公開一種面向異構眾核平臺的Im2col加速方法,C*H*W的張量經過Im2col變換后的矩陣形狀為C*Kh*Kw*Ho*Wo,其中C是通道數,H和W分別為輸入的高度和寬度,Kh和Kw為卷積核大小,Ho和Wo為輸出張量的高度和寬度;根據C*Kh的大小選擇不同的算法:當C*Kh大于等于64時,從變換后的矩陣出發,按照C*Kh進行任務劃分;當C*Kh小于64時,從變換前的矩陣出發,按照C*H進行任務劃分。本發明有效提高了Im2col變換的運算效率,作為卷積計算的前處理過程,有效保障了卷積算子和卷積神經網絡的高效運行。
本發明授權一種面向異構眾核平臺的Im2col加速方法在權利要求書中公布了:1.一種面向異構眾核平臺的Im2col加速方法,C*H*W的張量經過Im2col變換后的矩陣形狀為C*Kh*Kw*Ho*Wo,其中C是通道數,H和W分別為輸入的高度和寬度,Kh和Kw為卷積核大小,Ho和Wo為輸出張量的高度和寬度;其特征在于:根據C*Kh的大小選擇不同的算法:當C*Kh大于等于64時,從變換后的矩陣出發,按照C*Kh進行任務劃分;當C*Kh小于64時,從變換前的矩陣出發,按照C*H進行任務劃分;當C*Kh大于等于64時,根據輸出張量的Ho和輸入張量的W選擇不同的實現:當Ho*W小于可分配的最大空間時,計算過程如下:S11、按照C*Kh將變換后的矩陣以Kw行為單元進行任務劃分,映射到從核核組;S12、對變換后矩陣中的Kw行,通過DMA從輸入張量一次讀入對應的Ho*W個數據;S13、對同一行的Kw個卷積核元素,從讀入數據分別可以得到對應的Ho*Wo個結果;S14、分Kw次將每個卷積核對應的結果通過DMA寫回主存對應位置;當Ho*W大于可分配的最大空間時,計算過程如下:S21、按照C*Kh將變換后的矩陣以Kw行為單元進行任務劃分,映射到從核核組;S22、根據局部存儲空間的大小,計算一行W個元素時,可容納的最大行數col_block;S23、對變換后矩陣中的Kw行,在Ho方向進行劃分,分批次通過跨步DMA讀入,每次讀入col_block*W的數據,總的DMA數據量為Ho*W;S24、根據讀入的col_block*W的數據,對同一行的Kw個卷積核元素,可以得到col_block*Wo個結果;S25、分Kw次將每個卷積核對應的結果通過DMA寫回主存對應位置;當C*Kh小于64時,從輸入張量出發,按照C*H進行任務劃分,以輸入張量的一行為單元進行計算,計算過程如下:S31、將變換后矩陣中的所有元素初始化為0;S32、按照C*H將輸入張量以行為單位進行任務劃分,映射到從核核組;S33、每次通過DMA讀入一行輸入張量元素;S34、對于輸入矩陣中的一行,在列方向對卷積核進行循環,確定輸出矩陣Ho方向的位置;S35、在行方向對卷積核進行循環,得到每個卷積核對應的元素,通過跨步DMA將Kw*Wo的數據寫回主存。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人無錫江南計算技術研究所,其通訊地址為:214038 江蘇省無錫市濱湖區山水東路699號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。