恭喜南京郵電大學徐佳獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜南京郵電大學申請的專利基于多智能體強化學習的動車組視頻協同緩存方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119676476B 。
龍圖騰網通過國家知識產權局官網在2025-06-03發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510187523.X,技術領域涉及:H04N21/234;該發明授權基于多智能體強化學習的動車組視頻協同緩存方法是由徐佳;周龍;湯耀杰;劉姝雅;李德強;劉林峰;肖甫;蔣凌云設計研發完成,并于2025-02-20向國家知識產權局提交的專利申請。
本基于多智能體強化學習的動車組視頻協同緩存方法在說明書摘要公布了:本發明公開一種基于多智能體強化學習的動車組視頻協同緩存方法,包括:構建動車組多車廂協同緩存視頻服務系統;根據用戶請求緩存命中情況,定義請求響應時間成本;根據相鄰時段緩存視頻內容差異,定義資源替換時間成本;形式化動車組視頻服務時間成本最小化問題;調用基于多智能體強化學習的多車廂協同緩存算法,確定每個時段的視頻內容緩存策略。本發明將視頻內容緩存在動車組車廂上,考慮不同車廂的差異性以及線性組網的問題,設計多車廂協同緩存系統及方法,加速用戶獲取視頻內容,提高緩存空間利用率。
本發明授權基于多智能體強化學習的動車組視頻協同緩存方法在權利要求書中公布了:1.一種基于多智能體強化學習的動車組視頻協同緩存方法,其特征在于,包括以下步驟:S100.構建動車組多車廂協同緩存視頻服務系統,包括定義動車組車廂集合與視頻內容集合,將動車組運行時間按照站點之間的行駛時間劃分為時段;S200.根據用戶請求緩存命中情況,定義請求響應時間成本,包括車廂內響應、車廂間響應和外部基站響應;S300.根據相鄰時段緩存視頻內容差異,定義資源替換時間成本;S400.形式化動車組視頻服務時間成本最小化問題;S500.調用基于多智能體強化學習的多車廂協同緩存算法,確定每個時段的視頻內容緩存策略,其中每個車廂被視為一個智能體,采用神經網絡擬合智能體的動作,并設置兩個評價網絡進行協同優化;將所有智能體在時段的數據以五元組的形式存入樣本池,包括全局狀態、全局動作、下一時段的全局狀態、獎勵集合和結束標識;若樣本數量達到最小批處理閾值,則對神經網絡進行訓練,更新目標網絡參數;具體包括:S510、將每個車廂視為一個智能體,以車廂編號i表示車廂對應的智能體;采用神經網絡擬合智能體i的動作,記為訓練動作網絡其中θi為智能體i的訓練動作網絡參數,對應的目標動作網絡記為針對每個智能體i,設置兩個訓練評價網絡,分別記作和其中wi,1為智能體i的第一個訓練評價網絡參數,對應的目標網絡為而wi,2為智能體i的第二個訓練評價網絡參數,對應的目標網絡為S520、定義每個智能體i在t時段的狀態,包括在t時段車廂本身資源緩存情況、在t時段車廂內用戶請求情況、車廂屬性和在t時段的地點屬性;記車廂屬性集合為U,地點屬性集合為V,則智能體i在t時段的狀態表示為其中ui∈U代表智能體i所處的車廂屬性,代表該智能體i當前所處的地點屬性,表示車廂i緩存服務器在t時段的緩存情況,表示車廂i用戶在t時段對視頻內容的請求情況;S530、根據獲取的智能體在t時段的狀態,訓練動作網絡輸出每個視頻內容f的緩存概率;對每個視頻內容f的緩存概率從大到小進行排序,選出前ci個視頻內容作為最終的緩存動作;定義智能體的動作為其中,若智能體i在t時段緩存內容f,則否則,且S540、每個智能體i執行動作狀態由進入下一狀態環境給出獎勵定義為t時段智能體i請求響應時間成本與資源替換時間成本加權和的負值,表示為: S550、將所有智能體在t時段的數據除去時間屬性后以o,a,o′,r,d五元組的形式存入樣本池中D,其中,表示所有智能體的局部觀測狀態組成的全局狀態;表示所有智能體的局部動作組成的全局動作;表示下一時段的全局狀態;表示獎勵集合;d∈{0,1}為二元指示變量,若動車組到達終點站則d=1,否則,d=0;S560、若樣本數量達到最小批處理閾值G,對神經網絡進行訓練,更新目標網絡參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京郵電大學,其通訊地址為:210003 江蘇省南京市鼓樓區新模范馬路66號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。