恭喜河海大學衛志農獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜河海大學申請的專利一種基于多智能體強化學習獎勵再分配的綜合能源站運行方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120013086B 。
龍圖騰網通過國家知識產權局官網在2025-06-13發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510479649.4,技術領域涉及:G06Q10/063;該發明授權一種基于多智能體強化學習獎勵再分配的綜合能源站運行方法是由衛志農;李佩樾;陳勝;金珈輝;孫國強;臧海祥;朱瑛;韓海騰;黃蔓云;周亦洲;程禮臨設計研發完成,并于2025-04-17向國家知識產權局提交的專利申請。
本一種基于多智能體強化學習獎勵再分配的綜合能源站運行方法在說明書摘要公布了:本發明公開了一種基于多智能體強化學習獎勵再分配的綜合能源站運行方法,基于深度強化學習方法,通過獎勵再分配解決交通場景中的延遲獎勵問題。本發明建立了包含電動汽車、燃料電池車及燃油車的混合動態用戶均衡模型,設計了融合優惠券動態決策與制氫、儲氫方法的綜合能源站運營框架;通過序列馬爾可夫決策過程刻畫了定價方法對站端收益與交通擁堵的跨時段影響,將延遲獎勵再分配為即時獎勵;針對配電網節點邊際電價與交通流量的時空耦合,構建了考慮配電網運行效用、交通網絡均衡與綜合能源站運營的協同決策模型,實現了充能、制氫需求時空轉移、交通擁堵動態緩解與綜合能效提升的聯合優化。
本發明授權一種基于多智能體強化學習獎勵再分配的綜合能源站運行方法在權利要求書中公布了:1.一種基于多智能體強化學習獎勵再分配的綜合能源站運行方法,其特征在于,該方法包括以下步驟: 步驟1、獲取電網模型的網絡系數和運行系數,所述網絡系數包括電網拓撲、線路電阻和阻抗,所述運行系數包括發電機組發電系數、儲能系統充放電系數、光伏逆變器系數、充電站參數; 步驟2、獲取電網負荷需求、光伏出力、車輛出行需求、平均充電和加氫歷史需求場景數據; 步驟3、以路段狀態方程、流量傳播約束、用戶比例分配約束、節點流量守恒約束、效用方程為約束條件,以交通網中用戶出行及充能效用最小為目標函數,建立基于動態用戶均衡的交通模型,根據該模型得到綜合能源站所屬節點的充能車流量; 步驟4、綜合能源站作為智能體,將基于步驟3得到的節點充能車流量作為智能體狀態的輸入,以售電及售氫的效用方程、儲氫量平衡約束、制氫約束、電能平衡約束、優惠券效用方程為約束條件,綜合能源站綜合收益最大為目標函數,建立綜合能源站運行模型; 步驟5、將步驟4中的目標函數作為多智能體強化學習獎勵再分配算法中觀測評價網絡的獎勵函數,通過獎勵再分配公式計算得到實際評價網絡的獎勵函數,獎勵再分配公式由觀測評價網絡的獎勵函數和價值函數構成,通過最大化實際評價網絡的獎勵函數實現綜合能源站收益的最大化; 步驟3中,動態用戶均衡模型為:A-1 式中,表示時刻,表示路段,表示t時刻路段的流入率,表示t時刻路段的通行效用; 步驟4中,以收益最大化為目標的綜合能源站運行模型為 A-18; 其中,表示時刻綜合能源站的總收益,表示時刻綜合能源站的售電收益,表示時刻綜合能源站的售氫收益,表示時刻綜合能源站的購電效用,表示時刻綜合能源站的制氫效用,表示時刻綜合能源站發放的優惠券效用; 步驟5中,觀測評價網絡的獎勵函數為: A-32 觀測評價網絡的價值函數: A-33 獎勵再分配公式: A-34 最大化實際評價網絡的獎勵函數: A-35 式中,表示時刻在狀態及動作下觀測評價網絡的獎勵函數,表示時刻在狀態及動作下觀測評價網絡的價值函數,表示在策略下的期望值,表示時刻的折扣因子,表示執行動作后的下一個狀態,表示下個狀態下選擇的動作,表示時刻下個狀態、動作的價值函數,表示實際評價網絡的獎勵函數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人河海大學,其通訊地址為:211100 江蘇省南京市江寧開發區佛城西路8號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。