恭喜重慶大學范敏獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜重慶大學申請的專利一種基于強化學習的配電變壓器經濟運維方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116128153B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310243797.7,技術領域涉及:G06Q10/04;該發明授權一種基于強化學習的配電變壓器經濟運維方法是由范敏;馮楚瑞;彭港;彭嶼雯;張煥嬌;王孝中設計研發完成,并于2023-03-14向國家知識產權局提交的專利申請。
本一種基于強化學習的配電變壓器經濟運維方法在說明書摘要公布了:本發明提出了一種基于強化學習的配電變壓器經濟運維方法,主要步驟為:1從配電變壓器在線運行數據和基礎信息中提取配電變壓器的多維特征;2在配電變壓器運行狀態多維感知基礎上,建立基于數據驅動的配電變壓器運行狀態評估及態勢預測模型;3通過DQN算法訓練智能體與配電變壓器交互的強化學習過程,得到配電變壓器維護策略優化模型;4將該臺配電變壓器運行狀態的預測結果構建成狀態信息輸入到配電變壓器維護策略優化模型中,得到預測性維護決策序列。本發明具有較好的通用性和應用性,適用于油浸式配電變壓器和干式配電變壓器,能夠得到預測性維護決策序列,為配電運維人員實施更加客觀和準確的主動維護提供指導。
本發明授權一種基于強化學習的配電變壓器經濟運維方法在權利要求書中公布了:1.一種基于強化學習的配電變壓器經濟運維方法,其特征在于,主要包括以下步驟:1從配電變壓器在線運行數據和基礎信息中提取配電變壓器的多維特征;2在配電變壓器運行狀態多維感知基礎上,建立基于數據驅動的配電變壓器運行狀態評估及態勢預測模型;3通過DQN算法訓練智能體與配電變壓器交互的強化學習過程,得到配電變壓器維護策略優化模型,模型構建主要步驟如下:3.1在配電變壓器經濟運維策略優化的強化學習任務中,狀態S、維護動作A和獎勵R強化學習要素的具體設置如下:3.1.1配電變壓器的狀態包含配電變壓器的運行狀態特征features和運行狀態評估結果score,第i時刻的狀態si表達式為:si={features,score},si∈S1式1中,運行狀態特征有負載率、電壓偏差和三相負荷不平衡度、平均負載率、重載持續時間、過載持續時間、平均三相負荷不平衡度和三相負荷不平衡持續時間;S是一個無限的狀態集合,并且狀態之間的轉移概率是未知的;配電變壓器狀態分為初始狀態s0、一般狀態si和終止狀態sT三種情況;初始狀態是指智能體與配電變壓器交互過程中的第一個狀態,這個狀態下配電變壓器運行良好,運行狀態評估結果在正常范圍內;終止狀態是指配電變壓器發生了故障,智能體與配電變壓器交互過程結束;一般狀態是指除了初始狀態和終止狀態之外的狀態,這個狀態下配電變壓器運行可能正常,也可能發生故障;3.1.2智能體有兩種維護動作選擇,第一種是對配電變壓器不做維修處理ano,第二種是對配電變壓器進行維修處理arepair,第i時刻智能體執行的動作ai表達式為:ai={anoorarepair},ai∈A2當智能體選擇執行arepair時,表明經濟運維策略優化模型給出的決策建議是對配電變壓器進行維修;arepair動作細化,即根據配電變壓器當前的監測狀態細化針對性維修處理動作,維修過后配電變壓器狀態轉變為初始狀態;3.1.3智能體第i時刻獲得的獎勵ri由當前執行的維護動作ai和配電變壓器反饋的下一時刻狀態si+1共同決定;如果si+1為終止狀態,智能體獲得的獎勵ri為-1,智能體與配電變壓器交互過程結束;如果si+1為一般狀態,獎勵ri的計算公式為: 式3中,獎勵ri的數值范圍在0到1之間;score為下一時刻狀態si+1中的配電變壓器運行狀態評估結果;loss為智能體在不同場景下執行維護動作ai的經濟損失;獎勵ri前半部分β1score與配電變壓器的安全運行相關,β1為安全目標系數;獎勵ri后半部分β2100-loss與配電變壓器維護的經濟成本相關,β2為經濟目標系數;3.2在DQN算法訓練智能體與配電變壓器交互的學習過程中,DQN訓練智能體獲取配電變壓器狀態s要素,通過梯度下降算法優化近似價值函數與真實價值函數的誤差,從而計算出近似價值函數的權重參數w;再通過深度神經網絡擬合真實動作價值函數,得到近似動作價值函數并利用Q-learning算法更新近似動作價值函數從而獲得最優策略為了提高算法的效率和穩定性,DQN訓練智能體中引入經驗回放和固定Q目標的機制;3.3設置智能體維護決策間隔時間,配電變壓器在運行過程中發生故障的情況并不常見,為了使配電變壓器經濟運維的強化學習訓練過程能夠盡快完成,除了將配電變壓器發生故障的情況作為終止狀態,把智能體在時間尺度上累計執行維護動作的情況也視作終止狀態;智能體在前一種終止狀態下獲得的獎勵為-1,在后一種終止狀態下獲得的獎勵為0;在DQN訓練過程中,每隔一段時間計算一次智能體獲得的回報平均值,隨著訓練輪數的增加,智能體獲得的回報平均值逐漸收斂,并完成訓練過程;3.4在基于DQN的配電變壓器經濟運維流程中,通過DQN算法訓練智能體與配電變壓器交互的強化學習過程,挖掘配電變壓器狀態衰變與發生故障之間復雜動態關聯的不確定性,得到配電變壓器經濟運維策略優化模型;4將配電變壓器運行狀態的預測結果構建成狀態信息輸入到配電變壓器維護策略優化模型中,得到預測性維護決策序列。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人重慶大學,其通訊地址為:400044 重慶市沙坪壩區沙正街174號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。