恭喜湘潭大學唐明華獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜湘潭大學申請的專利一種基本線性代數子程序的存算架構及其實現方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119357123B 。
龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411919354.6,技術領域涉及:G06F15/78;該發明授權一種基本線性代數子程序的存算架構及其實現方法是由唐明華;劉睿;邊疆設計研發完成,并于2024-12-25向國家知識產權局提交的專利申請。
本一種基本線性代數子程序的存算架構及其實現方法在說明書摘要公布了:本發明公開了一種基本線性代數子程序的存算架構及其實現方法,存算架構包括采用H樹互連的多個處理引擎PE,每個處理引擎中包括采用H樹互連的多個處理單元CU,每個處理單元中包括多個陣列,每個陣列包含一組輸入寄存器和指數寄存器、一個指數計算單元、一個延遲單元和一個配備有一組外圍組件的基于非易失性存儲器的Crossbar陣列。本發明針對各個BLAS函數設計了相應數據流和執行機制,突破了傳統存算一體架構固定算子限制,擴展了現有外圍模塊的潛力,在不需要額外模塊硬件支持的情況下,將矩陣轉置、減法和除法等復雜運算映射到移位累加器中,可以高效滿足科學計算需求。
本發明授權一種基本線性代數子程序的存算架構及其實現方法在權利要求書中公布了:1.一種基本線性代數子程序的存算架構的實現方法,應用于基本線性代數子程序的存算架構,其特征在于,基本線性代數子程序的存算架構包括采用H樹互連的多個處理引擎PE,每個處理引擎中包括采用H樹互連的多個處理單元CU,每個處理單元中包括多個陣列,每個陣列包含一組輸入寄存器和指數寄存器、一個指數計算單元、一個延遲單元和一個配備有一組外圍組件的基于非易失性存儲器的Crossbar陣列,指數計算單元、延遲單元和Crossbar陣列用于實現浮點數的乘法累加運算,外圍組件包括感測放大器、采樣保持電路、模數轉換器以及移位累加器;多個陣列以單指令多數據流方式在每個工作周期中接收指令并執行相應的操作;矩陣直接映射到不同PE上,每個PE中的子矩陣被進一步劃分為塊并存儲在不同的CU中,塊通過H樹的節點組合在一起;在CU中,數據被水平分割,每個陣列存儲矩陣的一行,不同的矩陣可在同一PE或CU內映射,以滿足各種矩陣計算要求;在執行矩陣乘法累加操作時,PE中的矩陣被分解為多個塊并映射到不同的CU,同一列中的兩個塊的輸出需要累加;陣列中的浮點數分為指數部分和尾數部分,分別存儲在指數寄存器和Crossbar陣列中;對于符號位,通過將偏置常數設置為尾數來表示負數,從而消除了存儲符號位的需要;輸入寄存器用于接收要處理的數據,并將其預分解為指數和尾數,以方便后續計算;存算架構中包括以下函數:SCAL、DOT、ASUM、NRM2、GEMV、GEMM、TRSV、TRSM、GER、SYR、SYR2、SYRK和SYR2K;執行DOT函數時,假設每個CU配置有4×4個陣列,每個陣列的輸入寄存器存儲一個4位尾數;節點作為陣列的移位累加器,通過使用移位累加器進行對齊操作,并擴展到執行浮點加法,每個節點將從陣列或前一個節點接收數據,并執行累加操作;ASUM函數和NRM2函數看作是DOT函數的子操作;ASUM函數計算所有向量中元素的和,在執行ASUM函數時,從每個陣列讀出相應的數據,并使用漣漪流水線執行求和操作;執行NRM2函數時,每個陣列首先執行讀取操作,并將讀取的數據反饋到其輸入寄存器中,向量自身執行DOT函數以獲得中間結果,然后將中間結果發送到協處理器或CPU進行平方根計算。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湘潭大學,其通訊地址為:411105 湖南省湘潭市西郊;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。