恭喜北京同方智科科技有限公司王帥獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜北京同方智科科技有限公司申請的專利基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119443312B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-05-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510027115.8,技術(shù)領(lǐng)域涉及:G06N20/00;該發(fā)明授權(quán)基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法是由王帥;范黎;于斌;路靜;唐微微設(shè)計研發(fā)完成,并于2025-01-08向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法在說明書摘要公布了:本發(fā)明公開了基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法,包括:通過設(shè)立一個包含多個智能體的聯(lián)邦學(xué)習(xí)框架,智能體分別位于不同的區(qū)域內(nèi),利用所在區(qū)域的數(shù)據(jù)進(jìn)行局部模型的訓(xùn)練;聯(lián)邦學(xué)習(xí)框架內(nèi),在每個智能體內(nèi)部部署分層強(qiáng)化學(xué)習(xí)模型;利用分層強(qiáng)化學(xué)習(xí)模型,使多個智能體在博弈環(huán)境中進(jìn)行對抗訓(xùn)練;在博弈對抗的基礎(chǔ)上,對智能體進(jìn)行監(jiān)測,基于監(jiān)測數(shù)據(jù)引入?yún)f(xié)同決策算法,協(xié)調(diào)多個智能體的行為;在達(dá)到預(yù)設(shè)的訓(xùn)練輪次或滿足特定條件時,將本地模型參數(shù)上傳至中央服務(wù)器,進(jìn)行全局優(yōu)化。本發(fā)明方法能夠確保在保護(hù)隱私的前提下,實現(xiàn)多智能體間的高效協(xié)同與策略優(yōu)化,在復(fù)雜多變的環(huán)境中保持高度的適應(yīng)性和魯棒性。
本發(fā)明授權(quán)基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法在權(quán)利要求書中公布了:1.基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法,其特征在于,該方法包括:步驟S1,設(shè)立一個包含多個智能體的聯(lián)邦學(xué)習(xí)框架,智能體分別位于不同的區(qū)域內(nèi),利用所在區(qū)域的數(shù)據(jù)進(jìn)行局部模型的訓(xùn)練;步驟S2,聯(lián)邦學(xué)習(xí)框架內(nèi),在每個智能體內(nèi)部部署分層強(qiáng)化學(xué)習(xí)模型,包括頂層策略控制模型和個體策略執(zhí)行模型;步驟S3,利用分層強(qiáng)化學(xué)習(xí)模型,使多個智能體在博弈環(huán)境中進(jìn)行對抗訓(xùn)練;步驟S4,在博弈對抗的基礎(chǔ)上,對智能體進(jìn)行監(jiān)測,基于監(jiān)測數(shù)據(jù)引入?yún)f(xié)同決策算法,協(xié)調(diào)多個智能體的行為,避免沖突和死鎖,其中,監(jiān)測數(shù)據(jù)包括智能體的位置、速度、決策選擇、交互歷史;步驟S5,在達(dá)到預(yù)設(shè)的訓(xùn)練輪次或滿足特定條件時,每個智能體將本地模型參數(shù)上傳至中央服務(wù)器,通過聯(lián)邦學(xué)習(xí)框架共享模型參數(shù)進(jìn)行全局優(yōu)化,其中,預(yù)設(shè)的訓(xùn)練輪次指智能體利用所在區(qū)域數(shù)據(jù)進(jìn)行局部模型訓(xùn)練的輪次,本地模型是智能體位于不同區(qū)域內(nèi)的局部模型;其中在步驟S4中,還包括如下子步驟:S4-1,在博弈對抗的過程中,監(jiān)測并記錄各個智能體的行為、決策以及它們之間的相互作用;S4-2,基于監(jiān)測數(shù)據(jù),啟動協(xié)同決策算法,利用分層強(qiáng)化學(xué)習(xí)模型的頂層策略控制層來協(xié)調(diào)多個智能體的行為,具體公式為: ;其中,表示智能體i的策略,表示智能體i的獎勵函數(shù),表示在時間t時的全局狀態(tài),表示智能體i在時間t時的動作,表示智能體i和智能體j之間由于動作沖突產(chǎn)生的成本,是調(diào)節(jié)沖突成本的權(quán)重系數(shù);S4-3,根據(jù)協(xié)同決策算法的輸出,調(diào)整各個智能體的策略選擇,消除沖突和死鎖,優(yōu)化整體性能。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京同方智科科技有限公司,其通訊地址為:100080 北京市海淀區(qū)王莊路清華同方科技大廈A座25層室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜上海康路聯(lián)醫(yī)療科技有限公司梁金獲國家專利權(quán)
- 恭喜上海商湯智能科技有限公司吳佳飛獲國家專利權(quán)
- 恭喜安培簡式股份有限公司N·拉特獲國家專利權(quán)
- 恭喜羅伯特·博世有限公司S·甘策獲國家專利權(quán)
- 恭喜華為技術(shù)有限公司楊鴻志獲國家專利權(quán)
- 恭喜中集安瑞環(huán)科技股份有限公司沈駿獲國家專利權(quán)
- 恭喜東菱技術(shù)有限公司曹磊獲國家專利權(quán)
- 恭喜廣州文沖船廠有限責(zé)任公司王應(yīng)強(qiáng)獲國家專利權(quán)
- 恭喜佛山海爾滾筒洗衣機(jī)有限公司吉雪玲獲國家專利權(quán)
- 恭喜北京京東尚科信息技術(shù)有限公司李騰獲國家專利權(quán)


熱門推薦
- 恭喜美藝陶(福建)高新建材有限公司吳燕輝獲國家專利權(quán)
- 恭喜耐克創(chuàng)新有限合伙公司C.埃爾德姆獲國家專利權(quán)
- 恭喜空中客車運(yùn)營簡化股份公司奧利維爾·索爾尼克獲國家專利權(quán)
- 恭喜瑞典愛立信有限公司L·維爾赫姆森獲國家專利權(quán)
- 恭喜肇慶精銳電器五金有限公司陸學(xué)中獲國家專利權(quán)
- 恭喜三星電子株式會社崔俊輝獲國家專利權(quán)
- 恭喜北京夢之墨科技有限公司李亮獲國家專利權(quán)
- 恭喜北京小米移動軟件有限公司胡現(xiàn)坤獲國家專利權(quán)
- 恭喜美藝陶(福建)高新建材有限公司吳燕輝獲國家專利權(quán)
- 恭喜北京大學(xué)人民醫(yī)院林劍浩獲國家專利權(quán)