恭喜安徽大學姜入文獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜安徽大學申請的專利一種未知環境下基于強化學習的機器人主動導航方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115265547B 。
龍圖騰網通過國家知識產權局官網在2025-03-21發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211015078.1,技術領域涉及:G01C21/20;該發明授權一種未知環境下基于強化學習的機器人主動導航方法是由姜入文;周慶澳;李根宇;方逸仙設計研發完成,并于2022-08-23向國家知識產權局提交的專利申請。
本一種未知環境下基于強化學習的機器人主動導航方法在說明書摘要公布了:本發明公開了一種未知環境下基于強化學習的機器人主動導航方法,所述方法包括:創建仿真機器人模型;所述仿真機器人模型采用cartographer算法完成地圖構建;構建強化學習決策網絡,設計強化學習決策網絡的目標函數;在仿真機器人模型上進行強化學習決策網絡訓練,當目標函數值最小時,停止訓練,得到訓練好的強化學習決策網絡;將訓練好的強化學習決策網絡的網絡參數及cartographer算法參數移植到實體機器人中,將實體機器人放置到未知環境中,設置行走任務,機器人自主進行導航并避障;本發明的優點在于:適用無人機及地面小車不平坦區域,大范圍建圖消耗計算資源和內存較少,且訓練效率及算法精度較高。
本發明授權一種未知環境下基于強化學習的機器人主動導航方法在權利要求書中公布了:1.一種未知環境下基于強化學習的機器人主動導航方法,其特征在于,所述方法包括:步驟一:創建仿真機器人模型;步驟二:所述仿真機器人模型采用cartographer算法完成地圖構建;步驟三:構建強化學習決策網絡,設計強化學習決策網絡的目標函數,所述強化學習決策網絡的輸入為機器人的激光雷達掃描周圍環境的數據、機器人到目標位置的相對距離、機器人的前進速度和旋轉速度;所述強化學習決策網絡包括4層網絡,第一層卷積神經網絡的輸入為三個采樣時間的激光數據,第二層卷積神經網絡的輸入連接第一層卷積神經網絡的輸出,第三層網絡為和第四層網絡均為全連接層,第三層網絡的輸入連接第二層卷積神經網絡的輸出,第四層網絡的輸入包括第三層網絡的輸出、相對目標位置和機器人的當前速度,第四層網絡的輸出為機器人的輸出動作at;所述設計強化學習決策網絡的目標函數的過程為:通過公式 構建強化學習決策網絡的目標函數;其中,st表示強化學習決策網絡的狀態且表示三個單位時間內觀測到的激光雷達數據;表示目標點在機器人所在坐標系中的相對位置;表示觀測到的機器人當前的速度信息,v為線速度,ω為角速度;表示πθ′從st,at中采樣,并將其代入到min函數所得到期望值,pθat|st表示狀態st和動作at用θ采樣得到的概率,表示優勢函數,clip表示剪切函數,將限制在1-ε,1+ε范圍內,ε為第一超參數;步驟四:在仿真機器人模型上進行強化學習決策網絡訓練,當目標函數值最小時,停止訓練,得到訓練好的強化學習決策網絡;步驟五:將訓練好的強化學習決策網絡的網絡參數及cartographer算法參數移植到實體機器人中,將實體機器人放置到未知環境中,設置行走任務,機器人自主進行導航并避障。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人安徽大學,其通訊地址為:230039 安徽省合肥市蜀山區肥西路3號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。