恭喜燕山大學竇春霞獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網恭喜燕山大學申請的專利基于雙Q學習考慮經濟調節(jié)的孤島微電網多模式切換策略獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN114400704B 。
龍圖騰網通過國家知識產權局官網在2025-04-01發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202210079342.1,技術領域涉及:H02J3/38;該發(fā)明授權基于雙Q學習考慮經濟調節(jié)的孤島微電網多模式切換策略是由竇春霞;李桐舟設計研發(fā)完成,并于2022-01-24向國家知識產權局提交的專利申請。
本基于雙Q學習考慮經濟調節(jié)的孤島微電網多模式切換策略在說明書摘要公布了:本發(fā)明公開了基于雙Q學習考慮經濟調節(jié)的孤島微電網多模式切換策略,該策略包含兩種設計方案:1、設計了一種基于雙Q學習的混合控制策略,解決了微電網針對不同的外部環(huán)境,選擇電氣設備最優(yōu)切換指令問題;2、提出了一種基于共識算法的經濟控制方法,該方法采用協(xié)商一致性算法,解決了微電網發(fā)電邊際成本和污染排放的優(yōu)化問題;本發(fā)明對保證微電網穩(wěn)定運行,提升微電網經濟性能,降低微電網污染排放等方面問題具有一定的指導意義。
本發(fā)明授權基于雙Q學習考慮經濟調節(jié)的孤島微電網多模式切換策略在權利要求書中公布了:1.基于雙Q學習考慮經濟調節(jié)的孤島微電網多模式切換策略,其特征在于:設計混合控制結構,該結構為信息物理系統(tǒng),包括信息層和物理層;信息層包括D-S融合部分、雙Q學習部分和一致性控制部分;其中,D-S融合部分用于產生指示當前運行狀況的信號,提供合適的切換策略;雙Q學習部分用于針對不同的運行工況獨立搜索合適的控制策略;一致性控制部分用于降低柴油發(fā)電機的發(fā)電成本和污染物排放;物理層包括為用戶負荷提供電能的各能源發(fā)電儲能單元、傳感器和逆變器控制部分;其中,各能源發(fā)電儲能單元包括風力發(fā)電機、光伏發(fā)電、儲能單元和柴油發(fā)電機,用于提供電能維持負荷正常運行;傳感器用于傳輸物理層中各能源發(fā)電儲能單元的電壓數據,構成電壓判據;逆變器控制部分用于維持各能源發(fā)電儲能單元的正常運行;定義混合控制結構中風力發(fā)電機、柴油發(fā)電機、光伏發(fā)電、儲能單元以及用戶負荷的運行方式,傳感器將物理層母線節(jié)點的電壓數據傳輸到信息層,信息層根據傳輸的電壓數據并基于D-S融合部分生成電壓準則L,評價系統(tǒng)的整體穩(wěn)定性,同時為雙Q學習提供初始狀態(tài)值,基于雙Q學習算法得到多模態(tài)切換策略,將生成的模態(tài)切換信號發(fā)送到分布式的各能源發(fā)電儲能單元,完成分布式能源模式切換,同時對柴油發(fā)電機進行經濟調控,設計經濟控制策略,降低發(fā)電成本,減少污染物排放;基于D-S融合部分生成電壓準則L的步驟:首先,所有測量到的母線節(jié)點電壓偏差將形成一個識別框架U,它代表一個不確定元素Uij的總體集;然后利用D-S融合理論劃分的證據集對電壓識別框架進行判斷,得到每個個體的信度函數,通過D-S組合原則,對信息進行融合,將電壓偏差不符合規(guī)定的個體淘汰;最后,利用信息融合規(guī)則將多個判斷結果整合為一個新的電壓判斷指標,可作為評價微電網整體電壓穩(wěn)定性的綜合指標;基于雙Q學習算法得到多模態(tài)切換策略的方法如下:步驟一:雙Q學習算法采用經驗回放機制將采集到的數據以存儲單元的形式實時存儲,得到樣本存儲,Q將根據式1的方式進行更新: 式1中,是雙Q學習經驗回放機制下的Q值;Qtarget為目標Q值;Rt+1為回報函數;γ為學習因子,通常取0.01;St+1為狀態(tài)值,a為動作值;步驟二:將隨機選取的樣本作為當前網絡的輸入,并得到當前網絡Q,損失函數將由具有延遲C步的目標網絡獲得,θ通過式2將損失函數Liθi最小化來計算: 式2中,S為更新前的狀態(tài),a為更新前的動作;S′為更新后的狀態(tài),a′為更新后的動作;θi是第i次迭代中當前網絡的參數;是第i次迭代中目標網絡的參數;θi實時更新;在每次C迭代后更新;如果損失函數Liθi不同于θi,那么可用步驟三中梯度下降法對參數進行更新;步驟三:根據式3,用梯度下降法更新,每C步更新一次,得到目標Q: 式3中,為損失函數下降梯度;為S狀態(tài)下,a動作下Q的下降梯度;通過3式,可得θi和的更新公式: 其中θi+1和θi+c分別是第i+1次迭代和第i+c次迭代的網絡參數,α是Q值調整更新的學習速率,取值[0,1],根據公式3和4,Q可以定義為: 步驟四:發(fā)現動作集和狀態(tài)集將被發(fā)送到兩個QL過程,而且通過兩個網絡的合作,可以根據目前的外部環(huán)境和微電網的運營情況,有效的得到相應的動作指令。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人燕山大學,其通訊地址為:066004 河北省秦皇島市海港區(qū)河北大街438號;或者聯(lián)系龍圖騰網官方客服,聯(lián)系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。