恭喜京東城市(北京)數(shù)字科技有限公司張玥獲國(guó)家專利權(quán)
買(mǎi)專利賣(mài)專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜京東城市(北京)數(shù)字科技有限公司申請(qǐng)的專利基于超參優(yōu)化的深度強(qiáng)化學(xué)習(xí)模型的訓(xùn)練方法、裝置獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN113723615B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-06-17發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202011621981.3,技術(shù)領(lǐng)域涉及:G06N20/00;該發(fā)明授權(quán)基于超參優(yōu)化的深度強(qiáng)化學(xué)習(xí)模型的訓(xùn)練方法、裝置是由張玥;尹澤夏;霍雨森;王小波;鄭宇設(shè)計(jì)研發(fā)完成,并于2020-12-31向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本基于超參優(yōu)化的深度強(qiáng)化學(xué)習(xí)模型的訓(xùn)練方法、裝置在說(shuō)明書(shū)摘要公布了:本申請(qǐng)公開(kāi)了一種基于超參優(yōu)化的深度強(qiáng)化學(xué)習(xí)模型的訓(xùn)練方法、裝置,其中,方法包括:獲取多個(gè)初始超參數(shù)組合,和多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型;采用初始超參數(shù)組合中的多個(gè)超參數(shù)訓(xùn)練多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型,以得到與多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型分別對(duì)應(yīng)的訓(xùn)練評(píng)價(jià)指標(biāo);根據(jù)訓(xùn)練評(píng)價(jià)指標(biāo)從多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型之中篩選出第二深度強(qiáng)化學(xué)習(xí)模型;采用與第二深度強(qiáng)化學(xué)習(xí)模型對(duì)應(yīng)的多個(gè)目標(biāo)超參數(shù)對(duì)初始超參數(shù)組合進(jìn)行優(yōu)化處理,以形成目標(biāo)超參數(shù)組合;得到目標(biāo)深度強(qiáng)化學(xué)習(xí)模型。由此,將超參數(shù)優(yōu)化與模型訓(xùn)練結(jié)合起來(lái)實(shí)現(xiàn)深度強(qiáng)化學(xué)習(xí)模型的訓(xùn)練,不僅可訓(xùn)練出性能更高的深度強(qiáng)化學(xué)習(xí)模型,而且可使訓(xùn)練出的模型適應(yīng)更廣泛的應(yīng)用場(chǎng)景。
本發(fā)明授權(quán)基于超參優(yōu)化的深度強(qiáng)化學(xué)習(xí)模型的訓(xùn)練方法、裝置在權(quán)利要求書(shū)中公布了:1.一種基于超參優(yōu)化的深度強(qiáng)化學(xué)習(xí)模型的訓(xùn)練方法,所述方法用于工業(yè)領(lǐng)域的燃燒優(yōu)化控制,其特征在于,所述方法包括: 獲取多個(gè)初始超參數(shù)組合,和多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型; 采用所述初始超參數(shù)組合中的多個(gè)超參數(shù)訓(xùn)練所述多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型,以得到與所述多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型分別對(duì)應(yīng)的訓(xùn)練評(píng)價(jià)指標(biāo),其中所述多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型的輸入為狀態(tài)特征,輸出為動(dòng)作,所述狀態(tài)特征包括鍋爐燃燒過(guò)程中傳感器采集的數(shù)據(jù),所述動(dòng)作包括燃燒過(guò)程中可以調(diào)節(jié)的控制變量; 根據(jù)所述訓(xùn)練評(píng)價(jià)指標(biāo)從多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型之中篩選出第二深度強(qiáng)化學(xué)習(xí)模型; 采用與所述第二深度強(qiáng)化學(xué)習(xí)模型對(duì)應(yīng)的多個(gè)目標(biāo)超參數(shù)對(duì)所述初始超參數(shù)組合進(jìn)行優(yōu)化處理,以形成目標(biāo)超參數(shù)組合;以及 采用所述目標(biāo)超參數(shù)組合之中的多個(gè)超參數(shù)訓(xùn)練所述第二深度強(qiáng)化學(xué)習(xí)模型,以得到目標(biāo)深度強(qiáng)化學(xué)習(xí)模型; 其中,所述訓(xùn)練所述多個(gè)第一深度強(qiáng)化學(xué)習(xí)模型,包括: 基于所述初始超參數(shù)組合中的每一組超參數(shù)分別對(duì)第一強(qiáng)化學(xué)習(xí)模型進(jìn)行訓(xùn)練,引入多GPU進(jìn)行并行訓(xùn)練以生成模型組合。
如需購(gòu)買(mǎi)、轉(zhuǎn)讓、實(shí)施、許可或投資類(lèi)似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人京東城市(北京)數(shù)字科技有限公司,其通訊地址為:100086 北京市海淀區(qū)知春路76號(hào)(寫(xiě)字樓)1號(hào)樓9層1-7-5號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜英艾特股份公司H·馬克萊姆獲國(guó)家專利權(quán)
- 恭喜歐若拉運(yùn)營(yíng)公司斯蒂芬·C·克勞奇獲國(guó)家專利權(quán)
- 恭喜天津銘捷智能裝備有限公司崔普偉獲國(guó)家專利權(quán)
- 恭喜華為技術(shù)有限公司袁璞獲國(guó)家專利權(quán)
- 恭喜天津天汽集團(tuán)有限公司胡壯豐獲國(guó)家專利權(quán)
- 恭喜半導(dǎo)體組件工業(yè)公司J·P·甘比諾獲國(guó)家專利權(quán)
- 恭喜浙江三花智能控制股份有限公司H-D·艾希霍爾茨獲國(guó)家專利權(quán)
- 恭喜北京達(dá)佳互聯(lián)信息技術(shù)有限公司王祥林獲國(guó)家專利權(quán)
- 恭喜程朝卿獲國(guó)家專利權(quán)
- 恭喜杭州永創(chuàng)智能設(shè)備股份有限公司羅邦毅獲國(guó)家專利權(quán)


熱門(mén)推薦
- 恭喜中芯國(guó)際集成電路制造(上海)有限公司張?zhí)锾铽@國(guó)家專利權(quán)
- 恭喜株式會(huì)社NTT都科摩松村祐輝獲國(guó)家專利權(quán)
- 恭喜華帝股份有限公司李成信獲國(guó)家專利權(quán)
- 恭喜三星電子株式會(huì)社李潤(rùn)烈獲國(guó)家專利權(quán)
- 恭喜皇家飛利浦有限公司M·G·L·J·范烏登獲國(guó)家專利權(quán)
- 恭喜中國(guó)電力科學(xué)研究院有限公司王珂獲國(guó)家專利權(quán)
- 恭喜杰尼索尼克斯公司克里斯多佛·邁克爾·歐文斯獲國(guó)家專利權(quán)
- 恭喜高通股份有限公司G.切里安獲國(guó)家專利權(quán)
- 恭喜寶馬股份公司M·多梅林獲國(guó)家專利權(quán)
- 恭喜沈邕獲國(guó)家專利權(quán)