恭喜浙江大學;沐曦集成電路(上海)股份有限公司周昆獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜浙江大學;沐曦集成電路(上海)股份有限公司申請的專利基于模板的GPU高性能張量縮并方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115203634B 。
龍圖騰網通過國家知識產權局官網在2025-06-10發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210343327.3,技術領域涉及:G06F17/16;該發明授權基于模板的GPU高性能張量縮并方法是由周昆;侯啟明;蘆嘉良;任重設計研發完成,并于2022-03-31向國家知識產權局提交的專利申請。
本基于模板的GPU高性能張量縮并方法在說明書摘要公布了:本發明公開了一種基于模板的GPU高性能張量縮并方法,首先由用戶定義張量縮并,對其索引與維度進行分類,得到四個索引序列和四個維度序列;然后對其進行降維,得到訪存函數與隱式維度,再定義占位符,并根據BLAS庫實現與優化方法編寫計算模板,然后進行編譯期的模板派發,將訪存函數和隱式維度代入選定計算模板的占位符,生成CUDACC++代碼,并編譯為可重復使用的可執行程序,最后輸入各張量的數據,以及各維度的具體值,完成計算。本發明可以以有限的一組模板支持任意的張量縮并;在保持易用的前提下,系統性能仍然接近甚至超過手動優化的cuBLAS、cuDNN等計算庫。
本發明授權基于模板的GPU高性能張量縮并方法在權利要求書中公布了:1.一種基于模板的GPU高性能張量縮并方法,其特征在于,包括以下步驟:1用戶輸入張量縮并的定義,對其索引與維度進行分類,得到p,x,y,r四個索引序列,P,Y,X,R四個維度序列;1.1記號約定:將維度從高到低分別為D=Dn,…,D1的n維張量T,記作TD;用T[i]=T[in,...,i1]代表索引序列i=in,...,i1處的標量;函數extik=Dk,k=1,...,n,將單個索引映射到與之相對應的維度上,而Exti=extin,...,exti1=Dn,...,D1=D對索引序列映射為相應的維度序列;用戶輸入的任意張量縮并C=A×B均以愛因斯坦求和約定來表示:C[ic]=A[ia]×B[ib]1其中,ic、ia、ib分別為張量C、A、B的索引序列;2對索引序列p,x,y,r和維度序列P,Y,X,R進行降維,得到訪存函數與隱式維度;3定義占位符,表示隱式批量矩陣乘法中與訪存函數和隱式維度相關的內容;4根據BLAS庫實現與優化方法編寫計算模板,其中預留步驟3所述占位符;5進行編譯期的模板派發,將訪存函數和隱式維度代入選定計算模板的占位符,生成CUDACC++代碼;根據P,Y,X,R四個維度序列的內容是否為空,在編譯期選擇特定的線性代數計算模板: 選擇模板后,將占位符代入計算模板,生成合法的CUDACC++代碼;其中,GEDOT表示內積,GEMV表示矩陣-向量乘法,GER表示外積,GEMM表示矩陣乘法;6將步驟5生成的代碼編譯為可重復使用的可執行程序;7輸入各張量的數據,以及各維度的具體值,使用步驟6編譯出的可執行程序完成計算。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學;沐曦集成電路(上海)股份有限公司,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。