恭喜南京大學袁雷獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜南京大學申請的專利一種基于自然語言指令的高效人機協作策略部署方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119129638B 。
龍圖騰網通過國家知識產權局官網在2025-03-25發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411624958.8,技術領域涉及:G06N3/006;該發明授權一種基于自然語言指令的高效人機協作策略部署方法是由袁雷;俞揚;周志華;林錕珉;張子謙;李立和設計研發完成,并于2024-11-14向國家知識產權局提交的專利申請。
本一種基于自然語言指令的高效人機協作策略部署方法在說明書摘要公布了:本發明公開一種基于自然語言指令的高效人機協作策略部署方法,該方法借助于自然語言指導的條件擴散模型的強大表征能力,將多樣化隊友的最優協作策略參數壓縮為單個條件擴散模型,在部署階段基于人類隊友提供的自然語言指令,為隊友生成定制化的協作策略。該方法能夠在試錯成本較高的實際場景中僅通過少量自然語言指令實現協作策略的生成和部署,能夠保證人機協作策略部署的高效性。
本發明授權一種基于自然語言指令的高效人機協作策略部署方法在權利要求書中公布了:1.一種基于自然語言指令的高效人機協作策略部署方法,其特征在于,包括如下步驟:步驟1:根據協作場景,定義任務相關的事件,用于構造任務語言表征;步驟2:通過種群訓練方法或行為克隆構建多樣化的隊友種群,作為人類代理策略,并采集隊友對應的任務語言表征數據集和自然語言指令數據集;步驟3:為多樣化隊友種群訓練最優協作策略;首先為每個隊友策略初始化一個協作策略,然后固定隊友策略參數,通過PPO算法訓練協作策略到最優協作策略;步驟4:訓練策略參數編碼模塊和策略參數解碼模塊;策略參數編碼模塊和策略參數解碼模塊構成一個策略參數空間上的變分自編碼器,通過最小化損失函數聯合訓練;步驟5:微調Bert模型;在Bert模型輸出端添加全連接層,將Bert模型封裝為一個自然語言指令分類器,使用自然語言指令數據集,通過最小化交叉熵損失函數進行微調;步驟6:訓練語言轉換模塊;固定微調后的Bert模型的參數,僅訓練語言轉換模塊中的變分自編碼器,使其能夠將Bert模型編碼后的自然語言指令轉換為對應的任務語言表征;步驟7:壓縮最優協作策略;借助訓練得到的策略參數編碼模塊,將隊友種群的最優協作策略壓縮為策略參數表征數據集;步驟8:訓練條件擴散模型;使用任務語言表征數據集和策略參數表征數據集,通過最小化損失函數訓練條件擴散模型,使條件擴散模型根據任務語言表征生成對應的協作策略參數表征;步驟9:人類隊友使用自然語言指令表達其行為偏好或任務要求;步驟10:語言轉換模塊將自然語言指令轉化為任務語言表征;步驟11:隨機采樣高斯噪聲,借助條件擴散模型,反向去噪;步驟12:策略參數解碼模塊基于協作策略參數表征預測策略網絡參數,初始化協作策略網絡并加載策略網絡參數,得到重構的最優協作策略。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京大學,其通訊地址為:210023 江蘇省南京市棲霞區仙林大道163號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。