恭喜北京理工大學陳晨獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京理工大學申請的專利一種基于安全強化學習的分布式多機器人路徑規劃方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119394314B 。
龍圖騰網通過國家知識產權局官網在2025-05-13發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510002849.0,技術領域涉及:G01C21/20;該發明授權一種基于安全強化學習的分布式多機器人路徑規劃方法是由陳晨;申奧;吳秉鴻;繆昌昊;李楠;王元;鄧方;陳杰設計研發完成,并于2025-01-02向國家知識產權局提交的專利申請。
本一種基于安全強化學習的分布式多機器人路徑規劃方法在說明書摘要公布了:本發明屬于多機器人路徑規劃技術領域,具體涉及一種基于安全強化學習的分布式多機器人路徑規劃方法,為每個機器人提供分布式的運動策略,并有效降低機器人間發生沖突和碰撞的風險,提高運行效率。該方法設置狀態空間為小尺度三通道局部觀測地圖,包括局部距離代價地圖、鄰居相對位置地圖和鄰居目標相對位置地圖,將機器人與環境的信息以局部圖的形式表示,有效提升了規模和場景的泛化性,基于廣度優先搜索算法,構建了距離代價地圖,從而將全局信息引入局部觀測中,為易陷入局部最優的問題提供了有效的解決方案。
本發明授權一種基于安全強化學習的分布式多機器人路徑規劃方法在權利要求書中公布了:1.一種基于安全強化學習的分布式多機器人路徑規劃方法,其特征在于,包括以下步驟:機器人距離代價地圖獲?。簞摻ò鄠€機器人的二維環境,對于每一機器人獲取對應的距離代價地圖;神經網絡構建:構建一個全局神經網絡和個局部神經網絡,局部神經網絡與全局神經網絡相同,輸入為局部觀測地圖信息,輸出包括離散動作概率分布、狀態價值和阻塞預測;所述全局神經網絡用于策略的訓練,局部神經網絡用于機器人與環境分布式交互;神經網絡訓練:針對于每一機器人,利用其距離代價地圖獲取局部觀測地圖信息,輸入至對應的局部神經網絡中,將局部神經網絡的輸入與輸出組成訓練樣本,用于對全局神經網絡進行訓練;路徑規劃:利用訓練好的全局神經網絡,獲得分布式多機器人路徑規劃;在每一個時間步下,將局部觀測地圖信息作為狀態,計算在狀態下執行動作,基于設定的獎勵函數獲得的獎勵和得到下一時刻的狀態,并記錄終止標記和網絡輸出離散動作概率分布狀態價值以及實際是否發生阻塞的標簽,記錄七元組存儲到經驗回放池B中;所述設定的獎勵函數為: 其中,表示每一步移動的稠密懲罰,為局部代價地圖中心位置的對應值;表示發生特殊情況時的稀疏懲罰,包括發生碰撞或出界和阻塞其它機器人;表示關于狀態s和動作a的函數;將經驗回放池B采用出數據作為樣本數據,進行全局神經網絡訓練,所述全局神經網絡的損失函數為: 其中,為當前網絡的參數,為策略剪切損失,為價值損失,是策略的熵,為阻塞預測損失,、、、是權重超參數,為對采樣的所有時間步??的均值函數,為新策略和舊策略在狀態下選擇動作的概率之比,為度量當前動作比平均策略優勢程度的優勢估計,為限制變量上下界的裁剪函數,為限制策略更新幅度的超參數,為狀態的未來累積回報,為實際是否發生阻塞的標簽,為網絡預測的阻塞概率,為狀態下的離散動作概率分布。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京理工大學,其通訊地址為:100081 北京市海淀區中關村南大街5號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。