恭喜山東大學朱文興獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜山東大學申請的專利基于多智能體強化學習的區域交通優化控制方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117475621B 。
龍圖騰網通過國家知識產權局官網在2025-04-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311412460.0,技術領域涉及:G08G1/01;該發明授權基于多智能體強化學習的區域交通優化控制方法及系統是由朱文興;龔寶林;張韜設計研發完成,并于2023-10-27向國家知識產權局提交的專利申請。
本基于多智能體強化學習的區域交通優化控制方法及系統在說明書摘要公布了:本公開提供了基于多智能體強化學習的區域交通優化控制方法及系統,涉及區域交通控制技術領域,單智能體動作價值網絡采用集中式訓練、分布式執行,包括:將所有交叉口的局部狀態觀測作為輸入,輸入至單智能體的動作價值網絡中,使用多頭注意力機制對交通區域某T時刻的各個交叉口重要程度分配權重,利用超網絡對多頭注意力機制產生的高維度數據進行融合,分布式輸出各個動作的價值,選取最大價值所對應的動作,決策出各個交叉口在全局下的最優動作,實現對區域交通的最優控制。
本發明授權基于多智能體強化學習的區域交通優化控制方法及系統在權利要求書中公布了:1.基于多智能體強化學習的區域交通優化控制方法,其特征在于,包括:獲取交通區域各個交叉口的流量數據,定義多智能體強化學習參數;所述定義多智能體強化學習參數,包括:定義多智能體強化學習中的全局觀測狀態矩陣、局部觀測狀態矩陣、聯合動作、單智能體動作和獎勵函數;定義局部觀測狀態矩陣=[交叉口編號,t時刻道路車輛數量信息,0,t時刻相位信息];構建單智能體動作價值網絡,按照順序部署智能體網絡到對應的交叉口,獲取各個交叉口的局部觀測狀態矩陣輸入至動作價值網絡中,利用輸出的最大動作價值對應的動作進行控制執行,定義單智能體動作與多智能體聯合動作,定義{,},表示t時刻該交叉口保持相位不變,表示t時刻該交叉口信號相位改變,i代表第i個交叉口,代表第i個交叉口的動作;在后續價值網絡的輸出中,通過: ,{,}來進行動作選擇,其中,指的是動作價值網絡對執行動作的估值,在t時刻,定義整個交通區域的全局聯合動作為各個交叉口的動作線性組合,即: ={,,……}其中,表示t時刻,第i個交叉口的動作;其中,所述多智能體強化學習中的單智能體動作價值網絡,具體包括:搭建單智能體動作價值網絡,某個單智能體動作價值網絡控制某個區域下的一個單點交叉口的交通,所述單智能體動作價值網絡由多層感知機MLP、循環神經網絡GRU以及多層感知機MLP組成,輸入為多維的局部觀測數據以及隱藏層數據,輸出兩維的動作價值數值;所述單智能體動作價值網絡采用集中式訓練、分布式執行,包括:將所有交叉口的局部狀態觀測作為輸入,輸入至單智能體的動作價值網絡中,使用多頭注意力機制對交通區域某T時刻的各個交叉口重要程度分配權重,利用超網絡對多頭注意力機制產生的高維度數據進行融合,分布式輸出各個動作的價值,選取最大價值所對應的動作,決策出各個交叉口在全局下的最優動作,實現對區域交通的最優控制;所述使用多頭注意力機制對交通區域中T時刻的各個交叉口重要程度分配權重,包括:多頭注意力機制的值網絡通過各個單智能體輸出的動作價值數值進行輸入,查詢網絡與鍵網絡通過全局觀測與局部觀測進行輸入,且均由基礎的2層感知機網絡組成,層間網絡激活函數為RELU,通過softmax方法融合值網絡,鍵網絡,查詢網絡的輸出并得到最終的注意力權重。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人山東大學,其通訊地址為:250061 山東省濟南市歷下區經十路17923號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。