恭喜山東浪潮科學研究院有限公司劉敏獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜山東浪潮科學研究院有限公司申請的專利一種異構編譯優化方法、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119440544B 。
龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510046477.1,技術領域涉及:G06F8/41;該發明授權一種異構編譯優化方法、設備及介質是由劉敏;姜凱;趙鑫鑫;薛海軍設計研發完成,并于2025-01-13向國家知識產權局提交的專利申請。
本一種異構編譯優化方法、設備及介質在說明書摘要公布了:本申請公開了一種異構編譯優化的方法、設備及介質,涉及計算機軟件技術領域,用于解決編譯器如何準確合理地設置線程層次結構的問題。方法包括:編譯器編譯程序時,檢測到優化線程結構的宏后,設定迭代次數閾值、動態變化的迭代耗時逼近閾值和目標線程訪問耗時。查詢GPU硬件參數確定初始線程塊和網格參數值并編譯程序,獲取運行時線程訪問耗時。對比該耗時與目標耗時、迭代次數閾值及動態閾值,若滿足條件則執行迭代編譯,調整線程塊和網格參數值后重新編譯。如此循環,直至得出優化的線程塊和網格參數值,逼近目標線程訪問耗時,優化線程層次結構,這種迭代調整線程塊和網格大小的方式,大幅提升程序性能。
本發明授權一種異構編譯優化方法、設備及介質在權利要求書中公布了:1.一種異構編譯優化方法,其特征在于,所述方法包括:在CUDA編譯器對CUDA程序進行編譯時,若所述CUDA編譯器檢測到用于優化線程層次結構的宏定義,確定設定的迭代次數閾值、迭代耗時逼近動態閾值和目標線程訪問耗時;所述迭代耗時逼近動態閾值在迭代過程中會發生變化,以使得所述CUDA程序在運行時的線程訪問耗時逐步逼近所述目標線程訪問耗時;通過查詢當前GPU的硬件參數值,確定初始的線程塊參數值和網格參數值;硬件參數包括線程塊最大線程數、GPU中流多處理器的數量;根據所述線程塊參數值和所述網格參數值對CUDA程序進行編譯,得到運行時的線程訪問耗時;根據所述線程訪問耗時、所述目標線程訪問耗時、所述迭代次數閾值和所述迭代耗時逼近動態閾值,確定是否執行迭代編譯;若執行迭代編譯,根據所述線程訪問耗時對所述線程塊參數值和所述網格參數值進行調整,根據調整線程塊參數值與調整網絡參數值,對所述CUDA程序進行重新編譯;循環執行上述重新編譯過程,直至停止迭代編譯,生成優化線程塊參數值和優化網格參數值;所述根據所述線程訪問耗時、所述目標線程訪問耗時、所述迭代次數閾值和所述迭代耗時逼近動態閾值,確定是否執行迭代編譯,具體包括:在迭代次數小于所述迭代次數閾值時,將所述線程訪問耗時與所述目標線程訪問耗時進行對比;若所述線程訪問耗時大于所述目標線程訪問耗時,將所述線程訪問耗時與所述迭代耗時逼近動態閾值進行對比;若所述線程訪問耗時高于所述迭代耗時逼近動態閾值,確定執行迭代編譯;所述方法還包括:若所述線程訪問耗時小于或等于所述迭代耗時逼近動態閾值,將所述迭代耗時逼近動態閾值與所述目標線程訪問耗時輸入至預設耗時逼近表達式,根據輸出結果對迭代耗時逼近動態閾值進行更新;將更新的迭代耗時逼近動態閾值與所述線程訪問耗時進行重新對比;循環執行上述重新對比過程,直至所述線程訪問耗時高于更新的迭代耗時逼近動態閾值,確定執行迭代編譯。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人山東浪潮科學研究院有限公司,其通訊地址為:250101 山東省濟南市高新區浪潮路1036號S02號樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。