国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預訂訂單
服務訂單
發布專利 發布成果 人才入駐 發布商標 發布需求

在線咨詢

聯系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 IP管家助手 需求市場 關于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜大連理工大學劉洋獲國家專利權

恭喜大連理工大學劉洋獲國家專利權

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

龍圖騰網恭喜大連理工大學申請的專利一種基于深度強化學習的節能多智能體探索系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119761220B 。

龍圖騰網通過國家知識產權局官網在2025-05-27發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510258711.7,技術領域涉及:G06F30/27;該發明授權一種基于深度強化學習的節能多智能體探索系統是由劉洋;張鵬;趙潔;王棟;盧湖川;張平平設計研發完成,并于2025-03-06向國家知識產權局提交的專利申請。

一種基于深度強化學習的節能多智能體探索系統在說明書摘要公布了:本發明屬于人工智能、多智能體系統、深度強化學習以及自主探索領域,公開一種基于深度強化學習的節能多智能體探索系統,包括場景建模、效率導向觀察系統、代理間策略網絡、序列決策機制模塊和等待機制。本發明提出的效率導向觀察系統通過構建連接圖和交互圖的雙重結構,并為節點附加探索值、距離特征、復雜度信息等多維協作導向特征,使系統能精確把握環境特征和智能體間的交互關系,顯著提升多智能體系統的協同效率。本發明設計的序列決策機制模塊結合了序列決策機制和等待機制,通過讓智能體參考前序智能體的決策并在適當時候選擇等待,避免了盲目協作造成的能源浪費。

本發明授權一種基于深度強化學習的節能多智能體探索系統在權利要求書中公布了:1.一種基于深度強化學習的節能多智能體探索系統,其特征在于,該節能多智能體探索系統包括場景建模、效率導向觀察系統、代理間策略網絡、序列決策機制模塊和等待機制;(1)場景建模將待探索的場景定義為尺寸為的二維占用柵格地圖,其包含已探索區域和未探索區域,滿足;已探索區域進一步分為自由區域和占用區域,滿足;每個智能體配備有探測范圍為的激光掃描儀,用于更新已探索區域;在探索開始時,;節能多智能體探索系統的優化目標是尋找最短的智能體軌跡以完成整個區域的探索過程,同時確保探索過程中的能源效率和協作性能;(2)構建效率導向觀察系統先構建連接圖,用于刻畫環境的連通性;在已探索區域中均勻采樣,建立節點集合,并基于無碰撞路徑為每個節點與其個最近鄰居節點建立邊集合;連接圖隨著時間動態更新,智能體根據連接圖中鄰居節點的特征選擇下一步動作;為強化智能體間的協作關系,進一步構建交互圖,其節點集合與連接圖一致,邊集合為動態連接智能體的當前位置節點和具有非零探索值的目標節點,形成邏輯無向圖;在表征各節點探索價值的特征中,復雜度信息是關鍵特征,用于量化區域的探索難度和潛在協作需求;復雜度信息通過密度聚類算法對節點對應的邊界點進行聚類計算得到,反映區域內的分叉結構及探索復雜程度;(3)構建代理間策略網絡,通過注意力機制提升智能體的認知與決策能力,包含兩個編碼器和一個解碼器;兩個編碼器并行地從連接圖和交互圖中提取節點信息;均由6層多頭自注意力層組成,其中上層多頭自注意力層輸出的結果成為下層多頭自注意力層的輸入;每個多頭自注意力層的輸入包括查詢向量、鍵向量和值向量,通過學習矩陣、、生成,、、為隨機初始化的可迭代參數;權重由查詢向量與鍵向量的點積計算并經尺度因子歸一化后,通過softmax函數處理得到;為確保無邊連接的節點無信息傳遞,引入掩碼矩陣,當節點和節點之間存在邊時,否則;連接圖和交互圖并行通過兩個編碼器后,分別輸出的和被拼接并投影到維特征空間,生成增強節點特征;解碼器由一層注意力層和一層指針層組成,通過多階段處理生成動作概率分布;先從增強節點特征中提取當前節點特征和鄰居特征,將前節點特征作為查詢,增強節點特征作為鍵和值輸入注意力層;注意力層生成的輸出與前節點特征拼接后投影為當前增強特征;最終通過指針層生成動作概率分布,其中當前增強特征作為查詢,作為鍵和值;指針層動態調整動作空間,輸出策略分布,表示時刻選擇下一個節點的概率,其中表示時刻對應的環境觀測,分別表示時刻的決策點、時刻所在節點和時刻所在節點的所有鄰點;(4)序列決策機制模塊,將多智能體的動作分解為一系列有序的決策過程;在解碼器的指針層的輸入中,智能體的當前增強特征由前序動作進一步被增強,其中,對于智能體,節能多智能體探索系統將其前序智能體在時刻選擇的增強目標節點特征序列與解碼器輸出的當前增強節點特征進行拼接,此處,為第個智能體的,;拼接后的特征通過一個維度為的二維卷積層處理將其降維回統一維度,其中表示節能多智能體探索系統中智能體的總數,表示特征維度;最后,將卷積層的輸出作為新的輸入指針層,以整合前序動作信息;(5)等待機制,通過動態調節智能體的行為狀態,實現探索資源的合理分配和多智能體的高效協作。

如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人大連理工大學,其通訊地址為:116000 遼寧省大連市甘井子區凌工路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
主站蜘蛛池模板: 铁力市| 延津县| 那曲县| 寿宁县| 莱阳市| 监利县| 诏安县| 万载县| 榆树市| 思茅市| 泸溪县| 武城县| 崇义县| 海盐县| 四平市| 剑河县| 天峨县| 温州市| 固原市| 新巴尔虎右旗| 五峰| 双江| 建水县| 西吉县| 星子县| 定兴县| 平南县| 赣州市| 子长县| 惠水县| 辽中县| 安顺市| 镇江市| 东兰县| 临汾市| 屏山县| 崇明县| 金川县| 拜泉县| 古蔺县| 新河县|