恭喜材料科學姑蘇實驗室戴圣然獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜材料科學姑蘇實驗室申請的專利基于擴展卡爾曼濾波和強化學習的束線站參數優化方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119474620B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510053213.9,技術領域涉及:G06F17/11;該發明授權基于擴展卡爾曼濾波和強化學習的束線站參數優化方法是由戴圣然;王思宇;蔣建慧;張俊斌;方子君;吳爽設計研發完成,并于2025-01-14向國家知識產權局提交的專利申請。
本基于擴展卡爾曼濾波和強化學習的束線站參數優化方法在說明書摘要公布了:本申請涉及強化學習技術領域,尤其涉及一種基于擴展卡爾曼濾波和強化學習的束線站參數優化方法,包括基于初始策略和預設的目標狀態從環境中隨機選擇初始狀態并進行采樣,收集多條由連續經驗四元組組成的軌跡數據;在第一輪采樣使用收集到的軌跡數據訓練概率神經網絡得到狀態轉移模型;對于每條軌跡數據結合狀態轉移模型開展擴展卡爾曼濾波,使用濾波后的下一時刻狀態替換進每條軌跡數據的經驗四元組中并保存進經驗回放池;使用DDPG算法從經驗回放池中隨機采樣經驗四元組并對策略進行學習更新獲得新的策略,依此循環直至策略學習完成。本申請能夠緩解系統誤差帶來的影響,提高狀態估計的準確性,從而使得策略的學習更為精準。
本發明授權基于擴展卡爾曼濾波和強化學習的束線站參數優化方法在權利要求書中公布了:1.一種基于擴展卡爾曼濾波和強化學習的束線站參數優化方法,其特征在于,所述方法包括:基于初始策略和預設的目標狀態,從束線站系統所在環境中隨機選擇若干初始狀態并進行采樣,收集多條由連續經驗四元組組成的軌跡數據;在第一輪采樣中,使用收集到的軌跡數據訓練概率神經網絡得到狀態轉移模型;對于每條軌跡數據,結合所述狀態轉移模型開展擴展卡爾曼濾波,使用濾波后的下一時刻狀態替換進每條軌跡數據的經驗四元組中并將新的經驗四元組保存進經驗回放池;使用DDPG算法從所述經驗回放池中隨機采樣經驗四元組并對當前策略進行學習更新,獲得新的策略,依此循環直至策略學習完成。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人材料科學姑蘇實驗室,其通訊地址為:215000 江蘇省蘇州市工業園區若水路388號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。