国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預(yù)訂訂單
服務(wù)訂單
發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標(biāo) 發(fā)布需求

在線咨詢

聯(lián)系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務(wù) 國際服務(wù) 商標(biāo)交易 會員權(quán)益 IP管家助手 需求市場 關(guān)于龍圖騰
 /  免費(fèi)注冊
到頂部 到底部
清空 搜索
當(dāng)前位置 : 首頁 > 專利喜報 > 恭喜北京同方智科科技有限公司王帥獲國家專利權(quán)

恭喜北京同方智科科技有限公司王帥獲國家專利權(quán)

買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!

龍圖騰網(wǎng)恭喜北京同方智科科技有限公司申請的專利基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119443312B

龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-05-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510027115.8,技術(shù)領(lǐng)域涉及:G06N20/00;該發(fā)明授權(quán)基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法是由王帥;范黎;于斌;路靜;唐微微設(shè)計研發(fā)完成,并于2025-01-08向國家知識產(chǎn)權(quán)局提交的專利申請。

基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法在說明書摘要公布了:本發(fā)明公開了基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法,包括:通過設(shè)立一個包含多個智能體的聯(lián)邦學(xué)習(xí)框架,智能體分別位于不同的區(qū)域內(nèi),利用所在區(qū)域的數(shù)據(jù)進(jìn)行局部模型的訓(xùn)練;聯(lián)邦學(xué)習(xí)框架內(nèi),在每個智能體內(nèi)部部署分層強(qiáng)化學(xué)習(xí)模型;利用分層強(qiáng)化學(xué)習(xí)模型,使多個智能體在博弈環(huán)境中進(jìn)行對抗訓(xùn)練;在博弈對抗的基礎(chǔ)上,對智能體進(jìn)行監(jiān)測,基于監(jiān)測數(shù)據(jù)引入?yún)f(xié)同決策算法,協(xié)調(diào)多個智能體的行為;在達(dá)到預(yù)設(shè)的訓(xùn)練輪次或滿足特定條件時,將本地模型參數(shù)上傳至中央服務(wù)器,進(jìn)行全局優(yōu)化。本發(fā)明方法能夠確保在保護(hù)隱私的前提下,實現(xiàn)多智能體間的高效協(xié)同與策略優(yōu)化,在復(fù)雜多變的環(huán)境中保持高度的適應(yīng)性和魯棒性。

本發(fā)明授權(quán)基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法在權(quán)利要求書中公布了:1.基于聯(lián)邦學(xué)習(xí)的分層多智能體博弈對抗和協(xié)同決策方法,其特征在于,該方法包括:步驟S1,設(shè)立一個包含多個智能體的聯(lián)邦學(xué)習(xí)框架,智能體分別位于不同的區(qū)域內(nèi),利用所在區(qū)域的數(shù)據(jù)進(jìn)行局部模型的訓(xùn)練;步驟S2,聯(lián)邦學(xué)習(xí)框架內(nèi),在每個智能體內(nèi)部部署分層強(qiáng)化學(xué)習(xí)模型,包括頂層策略控制模型和個體策略執(zhí)行模型;步驟S3,利用分層強(qiáng)化學(xué)習(xí)模型,使多個智能體在博弈環(huán)境中進(jìn)行對抗訓(xùn)練;步驟S4,在博弈對抗的基礎(chǔ)上,對智能體進(jìn)行監(jiān)測,基于監(jiān)測數(shù)據(jù)引入?yún)f(xié)同決策算法,協(xié)調(diào)多個智能體的行為,避免沖突和死鎖,其中,監(jiān)測數(shù)據(jù)包括智能體的位置、速度、決策選擇、交互歷史;步驟S5,在達(dá)到預(yù)設(shè)的訓(xùn)練輪次或滿足特定條件時,每個智能體將本地模型參數(shù)上傳至中央服務(wù)器,通過聯(lián)邦學(xué)習(xí)框架共享模型參數(shù)進(jìn)行全局優(yōu)化,其中,預(yù)設(shè)的訓(xùn)練輪次指智能體利用所在區(qū)域數(shù)據(jù)進(jìn)行局部模型訓(xùn)練的輪次,本地模型是智能體位于不同區(qū)域內(nèi)的局部模型;其中在步驟S4中,還包括如下子步驟:S4-1,在博弈對抗的過程中,監(jiān)測并記錄各個智能體的行為、決策以及它們之間的相互作用;S4-2,基于監(jiān)測數(shù)據(jù),啟動協(xié)同決策算法,利用分層強(qiáng)化學(xué)習(xí)模型的頂層策略控制層來協(xié)調(diào)多個智能體的行為,具體公式為: ;其中,表示智能體i的策略,表示智能體i的獎勵函數(shù),表示在時間t時的全局狀態(tài),表示智能體i在時間t時的動作,表示智能體i和智能體j之間由于動作沖突產(chǎn)生的成本,是調(diào)節(jié)沖突成本的權(quán)重系數(shù);S4-3,根據(jù)協(xié)同決策算法的輸出,調(diào)整各個智能體的策略選擇,消除沖突和死鎖,優(yōu)化整體性能。

如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京同方智科科技有限公司,其通訊地址為:100080 北京市海淀區(qū)王莊路清華同方科技大廈A座25層室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

免責(zé)聲明
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
主站蜘蛛池模板: 盐源县| 延安市| 柘荣县| 怀化市| 新营市| 濉溪县| 甘洛县| 宁陕县| 苍山县| 阿图什市| 莱芜市| 临武县| 九江市| 疏附县| 伊吾县| 辰溪县| 广宁县| 台南市| 博乐市| 托克逊县| 台东市| 思茅市| 黔南| 辽源市| 丰台区| 贵阳市| 房产| 兴业县| 锡林浩特市| 丁青县| 海兴县| 浮梁县| 斗六市| 吐鲁番市| 右玉县| 澳门| 乐清市| 泗阳县| 关岭| 基隆市| 商都县|