恭喜華東交通大學陳世明獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜華東交通大學申請的專利一種機器人運動控制方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119839874B 。
龍圖騰網通過國家知識產權局官網在2025-06-03發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510315668.3,技術領域涉及:B25J9/16;該發明授權一種機器人運動控制方法及系統是由陳世明;羅翔設計研發完成,并于2025-03-18向國家知識產權局提交的專利申請。
本一種機器人運動控制方法及系統在說明書摘要公布了:本發明公開了一種機器人運動控制方法及系統,方法包括:獲取機器人運動前的環境信息,并根據所述環境信息,采用軌跡規劃算法規劃出所述機器人的最優軌跡;根據所述最優軌跡構建軌跡模仿獎勵函數,并將所述軌跡模仿獎勵函數加入至自適應動態獎勵函數,得到目標自適應動態獎勵函數;基于所述目標自適應動態獎勵函數控制所述機器人對所述最優軌跡進行模仿;根據改進裁剪機制的PPO深度強化學習算法對所述機器人的運動軌跡進行訓練和學習,最終得到所述機器人的最優控制策略。自適應動態獎勵機制能夠根據環境狀況動態調整獎勵權重,而參考軌跡獎勵則提供了方向性指引,這種組合在保持軌跡精確性的同時,能靈活地應對環境的實時變化。
本發明授權一種機器人運動控制方法及系統在權利要求書中公布了:1.一種機器人運動控制方法,其特征在于,包括:獲取機器人運動前的環境信息,并根據所述環境信息,采用軌跡規劃算法規劃出所述機器人的最優軌跡,其中,所述環境信息包括機器人的初始狀態、障礙物信息和動態目標信息;根據所述最優軌跡構建軌跡模仿獎勵函數,并將所述軌跡模仿獎勵函數加入至自適應動態獎勵函數,得到目標自適應動態獎勵函數,其中,所述軌跡模仿獎勵函數的表達式為: ,式中,為軌跡模仿獎勵函數,、、、、、分別為不同獎勵函數的重要程度,為局部精細化位置誤差獎勵函數,為軌跡覆蓋率獎勵函數,為速度誤差獎勵函數,為加速度誤差獎勵函數,為速度方向匹配獎勵函數,為軌跡時間弧長獎勵函數;其中,局部精細化位置誤差獎勵函數的表達式為: ,式中,為關鍵點數量,為第i個參考軌跡關鍵點的時間權重,為實際軌跡的關鍵點,為參考軌跡的關鍵點;軌跡覆蓋率獎勵函數的表達式為: ,式中,為總時間步數,為閾值;速度誤差獎勵函數的表達式為: ,式中,為實際軌跡速度,為參考軌跡速度;加速度誤差獎勵函數的表達式為: ,式中,為實際軌跡加速度,為參考軌跡加速度;速度方向匹配獎勵函數的表達式為: ,軌跡時間弧長獎勵函數的表達式為: , ,式中,為軌跡時間弧長,為實際的軌跡時間弧長,為參考的軌跡時間弧長;所述自適應動態獎勵函數包括動態獎勵函數和速度約束獎勵函數,所述動態獎勵函數包括目標距離獎勵函數、軌跡模仿獎勵函數、避障獎勵函數以及完成狀態獎勵函數;其中,所述自適應動態獎勵函數的表達式為: ,式中,為自適應動態獎勵函數,為基于機器人與障礙物的距離動態變化的因子;所述動態獎勵函數的表達式為: ,式中,為總時間步數,為折扣因子;目標距離獎勵函數的表達式為: , , ,式中,為動態權重,和均為調節參數,用于控制動態權重的變化速度和轉折點,表示機器人的位置,表示目標點的位置;避障獎勵函數的表達式為: ,式中,為控制避障懲罰的系數,為距離影響系數,為機器人與障礙物之間的距離;完成狀態獎勵函數的表達式為: ,式中,、均為控制獎勵程度的權重因子,為機器人完成任務的理想時間,為總時間步數;速度約束獎勵函數的表達式為: ,式中,、均為權重因子,為機器人關節數量,為第j個關節的速度,為第j個關節的加速度;基于所述目標自適應動態獎勵函數控制所述機器人對所述最優軌跡進行模仿;根據改進裁剪機制的PPO深度強化學習算法對所述機器人的運動軌跡進行訓練和學習,最終得到所述機器人的最優控制策略,其中,所述改進裁剪機制的表達式為: ,式中,為改進裁剪機制,、、、分別為不同裁剪區間的衰減斜率,、、分別為不同裁剪區間的裁剪寬度,,,為策略更新比。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華東交通大學,其通訊地址為:330000 江西省南昌市經濟技術開發區雙港東大街808號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。