當(dāng)前位置 : 首頁 > 專利喜報 > 恭喜北京同方智科科技有限公司王帥獲國家專利權(quán)

恭喜北京同方智科科技有限公司王帥獲國家專利權(quán)

買專利賣專利找龍圖騰，真高效！查專利查商標(biāo)用IPTOP,全免費(fèi)！專利年費(fèi)監(jiān)控用IP管家,真方便！

龍圖騰網(wǎng)恭喜北京同方智科科技有限公司申請的專利基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法獲國家發(fā)明授權(quán)專利權(quán)，本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予，授權(quán)公告號為：CN119443312B 。

龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-05-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉：該發(fā)明授權(quán)的專利申請?zhí)?專利號為：202510027115.8，技術(shù)領(lǐng)域涉及：G06N20/00；該發(fā)明授權(quán)基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法是由王帥;范黎;于斌;路靜;唐微微設(shè)計研發(fā)完成，并于2025-01-08向國家知識產(chǎn)權(quán)局提交的專利申請。

本基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法在說明書摘要公布了：本發(fā)明公開了基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法，包括：通過設(shè)立一個包含多個智能體的聯(lián)邦學(xué)習(xí)框架，智能體分別位于不同的區(qū)域內(nèi)，利用所在區(qū)域的數(shù)據(jù)進(jìn)行局部模型的訓(xùn)練；聯(lián)邦學(xué)習(xí)框架內(nèi)，在每個智能體內(nèi)部部署分層強(qiáng)化學(xué)習(xí)模型；利用分層強(qiáng)化學(xué)習(xí)模型，使多個智能體在博弈環(huán)境中進(jìn)行對抗訓(xùn)練；在博弈對抗的基礎(chǔ)上，對智能體進(jìn)行監(jiān)測，基于監(jiān)測數(shù)據(jù)引入?yún)f(xié)同決策算法，協(xié)調(diào)多個智能體的行為；在達(dá)到預(yù)設(shè)的訓(xùn)練輪次或滿足特定條件時，將本地模型參數(shù)上傳至中央服務(wù)器，進(jìn)行全局優(yōu)化。本發(fā)明方法能夠確保在保護(hù)隱私的前提下，實現(xiàn)多智能體間的高效協(xié)同與策略優(yōu)化，在復(fù)雜多變的環(huán)境中保持高度的適應(yīng)性和魯棒性。

本發(fā)明授權(quán)基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法在權(quán)利要求書中公布了：1.基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法，其特征在于，該方法包括：步驟S1，設(shè)立一個包含多個智能體的聯(lián)邦學(xué)習(xí)框架，智能體分別位于不同的區(qū)域內(nèi)，利用所在區(qū)域的數(shù)據(jù)進(jìn)行局部模型的訓(xùn)練；步驟S2，聯(lián)邦學(xué)習(xí)框架內(nèi)，在每個智能體內(nèi)部部署分層強(qiáng)化學(xué)習(xí)模型，包括頂層策略控制模型和個體策略執(zhí)行模型；步驟S3，利用分層強(qiáng)化學(xué)習(xí)模型，使多個智能體在博弈環(huán)境中進(jìn)行對抗訓(xùn)練；步驟S4，在博弈對抗的基礎(chǔ)上，對智能體進(jìn)行監(jiān)測，基于監(jiān)測數(shù)據(jù)引入?yún)f(xié)同決策算法，協(xié)調(diào)多個智能體的行為，避免沖突和死鎖，其中，監(jiān)測數(shù)據(jù)包括智能體的位置、速度、決策選擇、交互歷史；步驟S5，在達(dá)到預(yù)設(shè)的訓(xùn)練輪次或滿足特定條件時，每個智能體將本地模型參數(shù)上傳至中央服務(wù)器，通過聯(lián)邦學(xué)習(xí)框架共享模型參數(shù)進(jìn)行全局優(yōu)化，其中，預(yù)設(shè)的訓(xùn)練輪次指智能體利用所在區(qū)域數(shù)據(jù)進(jìn)行局部模型訓(xùn)練的輪次，本地模型是智能體位于不同區(qū)域內(nèi)的局部模型；其中在步驟S4中，還包括如下子步驟：S4-1，在博弈對抗的過程中，監(jiān)測并記錄各個智能體的行為、決策以及它們之間的相互作用；S4-2，基于監(jiān)測數(shù)據(jù)，啟動協(xié)同決策算法，利用分層強(qiáng)化學(xué)習(xí)模型的頂層策略控制層來協(xié)調(diào)多個智能體的行為，具體公式為：；其中，表示智能體i的策略，表示智能體i的獎勵函數(shù)，表示在時間t時的全局狀態(tài)，表示智能體i在時間t時的動作，表示智能體i和智能體j之間由于動作沖突產(chǎn)生的成本，是調(diào)節(jié)沖突成本的權(quán)重系數(shù)；S4-3，根據(jù)協(xié)同決策算法的輸出，調(diào)整各個智能體的策略選擇，消除沖突和死鎖，優(yōu)化整體性能。

如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù)，可聯(lián)系本專利的申請人或?qū)＠麢?quán)人北京同方智科科技有限公司，其通訊地址為：100080 北京市海淀區(qū)王莊路清華同方科技大廈A座25層室；或者聯(lián)系龍圖騰網(wǎng)官方客服，聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

免責(zé)聲明
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息，力求客觀、公正，但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解，僅供參考使用，不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。

相關(guān)閱讀

国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

龍圖騰網(wǎng)&IPTOP

設(shè)置信息完成注冊

手機(jī)號綁定多個賬號

恭喜北京同方智科科技有限公司王帥獲國家專利權(quán)

熱門推薦

專利交易買賣與高校科技成果轉(zhuǎn)化平臺

專利交易

快速入口

知產(chǎn)工具

關(guān)于我們

咨詢服務(wù)