恭喜四川邊緣算力科技有限公司賀強(qiáng)獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜四川邊緣算力科技有限公司申請的專利提高GPU資源利用率的分配方法、系統(tǒng)、介質(zhì)和程序產(chǎn)品獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119415272B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-03-25發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510018821.6,技術(shù)領(lǐng)域涉及:G06F9/50;該發(fā)明授權(quán)提高GPU資源利用率的分配方法、系統(tǒng)、介質(zhì)和程序產(chǎn)品是由賀強(qiáng)設(shè)計研發(fā)完成,并于2025-01-07向國家知識產(chǎn)權(quán)局提交的專利申請。
本提高GPU資源利用率的分配方法、系統(tǒng)、介質(zhì)和程序產(chǎn)品在說明書摘要公布了:本申請?zhí)峁┮环N提高GPU資源利用率的分配方法、系統(tǒng)、介質(zhì)和程序產(chǎn)品,涉及數(shù)據(jù)處理技術(shù)領(lǐng)域。該方法包括:構(gòu)建混合資源池,包括按設(shè)定算力和顯存顆粒度劃分的已劃分資源池及保留完整GPU資源單元的整塊備用資源池。接著從接口端獲取待處理任務(wù),利用基于多因素機(jī)器學(xué)習(xí)訓(xùn)練所得的任務(wù)分析模型確定其算力規(guī)模與連續(xù)性需求數(shù)據(jù)。最后依據(jù)這些數(shù)據(jù)按預(yù)設(shè)方法從混合資源池中分配算力資源,旨在應(yīng)對多樣化任務(wù)需求,實(shí)現(xiàn)GPU資源的高效靈活分配與利用,提升整體效率。
本發(fā)明授權(quán)提高GPU資源利用率的分配方法、系統(tǒng)、介質(zhì)和程序產(chǎn)品在權(quán)利要求書中公布了:1.一種提高GPU資源利用率的分配方法,應(yīng)用于資源分配系統(tǒng),其特征在于,所述方法包括:構(gòu)建包含已劃分資源池和整塊備用資源池的混合資源池,所述已劃分資源池是將GPU資源按照設(shè)定算力顆粒度和顯存顆粒度進(jìn)行劃分的資源池,所述整塊備用資源池是保留預(yù)設(shè)個數(shù)的完整GPU資源單元的資源池,所述設(shè)定算力顆粒度是指用于劃分計算資源的最小單位,所述顯存顆粒度是指結(jié)合GPU顯存容量劃分的顯存單元大小;從接口端獲取待處理任務(wù),通過任務(wù)分析模型確定所述待處理任務(wù)需要的算力規(guī)模數(shù)據(jù)和連續(xù)性需求數(shù)據(jù),所述任務(wù)分析模型是事先根據(jù)多個任務(wù)的輸入數(shù)據(jù)特征、算法復(fù)雜度、數(shù)據(jù)處理流程和歷史任務(wù)執(zhí)行記錄進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練而得,所述算力規(guī)模數(shù)據(jù)是指完成所述待處理任務(wù)所需的計算能力大小,所述連續(xù)性需求數(shù)據(jù)是指任務(wù)在執(zhí)行過程中對GPU資源連續(xù)占用和使用的要求程度;根據(jù)所述算力規(guī)模數(shù)據(jù)和所述連續(xù)性需求數(shù)據(jù)按照預(yù)設(shè)方法從所述已劃分資源池和所述整塊備用資源池中分配相應(yīng)的算力資源;在根據(jù)所述算力規(guī)模數(shù)據(jù)和所述連續(xù)性需求數(shù)據(jù)按照預(yù)設(shè)方法從所述已劃分資源池和所述整塊備用資源池中分配相應(yīng)的算力資源的步驟,具體包括:若所述待處理任務(wù)需要的所述算力規(guī)模小于設(shè)定算力閾值且所述連續(xù)性需求數(shù)據(jù)小于設(shè)定連續(xù)性程度閾值,則將所述待處理任務(wù)分配至所述已劃分資源池處理;若所述待處理任務(wù)需要的所述算力規(guī)模大于設(shè)定算力閾值且所述連續(xù)性需求數(shù)據(jù)小于設(shè)定連續(xù)性程度閾值,則將所述待處理任務(wù)中算力規(guī)模超過設(shè)定算力閾值部分對應(yīng)的待處理任務(wù)分配至所述整塊備用資源池處理;若所述待處理任務(wù)需要的所述算力規(guī)模大于設(shè)定算力閾值且所述連續(xù)性需求數(shù)據(jù)小于設(shè)定連續(xù)性程度閾值,則將所述待處理任務(wù)中算力規(guī)模超過設(shè)定算力閾值部分對應(yīng)的待處理任務(wù)分配至所述整塊備用資源池處理的步驟之后,還包括:若所述待處理任務(wù)的所述連續(xù)性需求數(shù)據(jù)大于設(shè)定連續(xù)性程度閾值,則將所述待處理任務(wù)先分配至已劃分資源池中進(jìn)行所述待處理任務(wù)的初步計算工作;在所述整塊備用資源池中搜索與所述待處理任務(wù)相匹配的完整GPU資源單元之后,暫停在所述已劃分資源池中執(zhí)行的任務(wù)處理工作;將任務(wù)的計算狀態(tài)信息數(shù)據(jù)遷移至所述完整GPU資源單元中并恢復(fù)任務(wù)執(zhí)行;在將任務(wù)的計算狀態(tài)信息數(shù)據(jù)遷移至所述完整GPU資源單元中并恢復(fù)任務(wù)執(zhí)行的步驟之后,還包括:實(shí)時統(tǒng)計所述已劃分資源池和所述整塊備用資源池的資源使用情況;當(dāng)所述已劃分資源池的使用率連續(xù)設(shè)定時長低于第一預(yù)設(shè)閾值時,將預(yù)設(shè)部分已劃分資源合并后轉(zhuǎn)入所述整塊備用資源池;當(dāng)所述整塊備用資源池的使用率連續(xù)設(shè)定時長低于第二預(yù)設(shè)閾值時,將部分完整GPU資源單元按照設(shè)定算力顆粒度劃分后轉(zhuǎn)入所述已劃分資源池;在將任務(wù)的計算狀態(tài)信息數(shù)據(jù)遷移至所述完整GPU資源單元中并恢復(fù)任務(wù)執(zhí)行的步驟之后,還包括:獲取所述待處理任務(wù)的優(yōu)先級信息;若所述混合資源池?zé)o法滿足高優(yōu)先級所述待處理任務(wù)需求時,則暫停所述已劃分資源池中正在處理的低優(yōu)先級任務(wù);回收所述低優(yōu)先級任務(wù)占用的資源,分配給所述高優(yōu)先級對應(yīng)的所述待處理任務(wù);在將任務(wù)的計算狀態(tài)信息數(shù)據(jù)遷移至所述完整GPU資源單元中并恢復(fù)任務(wù)執(zhí)行的步驟之前,還包括:根據(jù)所述待處理任務(wù)的數(shù)據(jù)結(jié)構(gòu)特點(diǎn)將所述待處理任務(wù)的處理狀態(tài)信息數(shù)據(jù)按照統(tǒng)一格式進(jìn)行保存;通過設(shè)定的編碼機(jī)制確定數(shù)據(jù)的完整性。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人四川邊緣算力科技有限公司,其通訊地址為:610000 四川省成都市中國(四川)自由貿(mào)易試驗(yàn)區(qū)成都高新區(qū)府城大道西段399號10棟16層1607號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜珠海格力電器股份有限公司段成杰獲國家專利權(quán)
- 恭喜普羅斯通信技術(shù)(蘇州)有限公司胡傳義獲國家專利權(quán)
- 恭喜樂金顯示有限公司孔忠植獲國家專利權(quán)
- 恭喜青島海爾洗碗機(jī)有限公司徐偉獲國家專利權(quán)
- 恭喜同源微(北京)半導(dǎo)體技術(shù)有限公司高占軍獲國家專利權(quán)
- 恭喜利樂拉瓦爾集團(tuán)及財務(wù)有限公司加博·本科獲國家專利權(quán)
- 恭喜暢想科技有限公司盧卡·尤利亞諾獲國家專利權(quán)
- 恭喜谷歌有限責(zé)任公司易卜拉欣·巴德爾獲國家專利權(quán)
- 恭喜青島海爾特種電冰柜有限公司徐磊獲國家專利權(quán)
- 恭喜中集安瑞環(huán)科技股份有限公司王勇獲國家專利權(quán)