国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預訂訂單
服務訂單
發布專利 發布成果 人才入駐 發布商標 發布需求

在線咨詢

聯系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 IP管家助手 需求市場 關于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜河南科技學院;新鄉市同興智能科技有限公司;有研(廣東)新材料技術研究院范玉千獲國家專利權

恭喜河南科技學院;新鄉市同興智能科技有限公司;有研(廣東)新材料技術研究院范玉千獲國家專利權

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

龍圖騰網恭喜河南科技學院;新鄉市同興智能科技有限公司;有研(廣東)新材料技術研究院申請的專利一種基于深度強化學習的鋰電池高安全快速充電方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119171590B

龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411650400.7,技術領域涉及:H02J7/00;該發明授權一種基于深度強化學習的鋰電池高安全快速充電方法是由范玉千;謝恒威;何盛亞;李軼;吳效瑩;謝朝舉;高國紅;王建平;何廣宇設計研發完成,并于2024-11-19向國家知識產權局提交的專利申請。

一種基于深度強化學習的鋰電池高安全快速充電方法在說明書摘要公布了:一種基于深度強化學習的鋰電池高安全快速充電方法,使用SP+模型對鋰電池進行建模;根據不同劣化階段對鋰電池所設定的脈沖工況,辨識得到不同SoH、不同SoC、不同溫度、不同倍率下的SP+模型參數;構建改進的深度強化學習SAC算法,并定義獎勵函數;將SP+模型作為改進SAC算法的智能體的交互環境,基于獎勵函數對智能體進行離線訓練,讓SAC算法的智能體學會在不同SoH、不同SoC、不同溫度、不同倍率下提供最優的安全快速充電策略;并用于鋰電池,在不同SoH、不同SoC、不同溫度、不同倍率下進行在線測試,輸出最優的安全快速充電策略;本發明能更好地理解和處理復雜的環境,并具有更好的泛化能力和自適應性。

本發明授權一種基于深度強化學習的鋰電池高安全快速充電方法在權利要求書中公布了:1.一種基于深度強化學習的鋰電池高安全快速充電方法,其特征在于:包括如下步驟:步驟1:使用SP+模型對鋰電池進行建模,并確定建模所需的辨識參數;步驟2:設定多種不同充、放電倍率下的脈沖工況,在不同溫度下對鋰電池進行劣化實驗;根據不同劣化階段對鋰電池所設定的脈沖工況,辨識得到不同SoH、不同SoC、不同溫度、不同倍率下的SP+模型參數;步驟3:構建改進的深度強化學習SAC算法,并定義獎勵函數;步驟4:將SP+模型作為改進SAC算法的智能體的交互環境,基于獎勵函數對智能體進行離線訓練,讓智能體學會在不同SoH、不同SoC、不同溫度、不同倍率下提供最優的安全快速充電策略;離線訓練包括以下步驟:步驟4.1:隨機初始化智能體中的策略網絡πθs和預測價值網絡的網絡參數θ和步驟4.2:利用智能體中的預測價值網絡參數來初始化智能體中的目標價值網絡的網絡參數步驟4.3:初始化經驗回放池容量D,初始化SP+模型的初始時刻狀態s0;步驟4.4:將初始時刻的狀態s0標準化為z0再輸入到策略網絡μa,σa=πθz0中,得到動作高斯分布的均值μa和標準差σa,對動作高斯分布進行單邊采樣得到動作采樣值ua,再對ua進行截斷操作輸出該時刻的策略動作a0;步驟4.5:將產生的策略動作a0輸入到SP+模型中,得到下一個時刻的狀態s1,計算獎勵r0=rs0,a0,將s0,a0,r0,s1作為一個樣本數據保存到經驗回放池中;步驟4.6:當經驗回放池中的樣本數量小于NB時,利用下一時刻的狀態,循環步驟4.4和4.5,得到一系列的樣本數據存放于經驗回放池中;當經驗回放池中的樣本數量大于NB時,執行步驟4.7;步驟4.7:從經驗回放池中隨機采樣NB個樣本數據st,at1,rt,st+1作為訓練數據,每個樣本的目標價值為:每個樣本的預測價值網絡為其中,st+1為上一個時刻的狀態,at1+1是策略網絡πθs根據st+1輸出的動作,γ表示折扣因子,用于削弱未來獎勵對當前狀態獎勵總和的影響,α表示動作熵logπθat1+1|st+1的加權因子;步驟4.8:通過最小化損失函數來更新預測價值網絡參數其中MSE[·]表示均方誤差,用于衡量目標價值和預測價值之間的誤差;步驟4.9:通過最小化KL散度期望來更新策略網絡參數θ:其中,E[·]表示期望;為了使得Jπθθ能夠正常計算梯度,令at1=μa+∈t*σa,其中,μa和σa分別表示策略網絡πθ輸出的均值和標準差,∈t表示從標準正態分布中采樣的噪聲;步驟4.10:使用軟更新策略更新目標價值網絡參數其中,τ表示軟更新參數;步驟4.11:通過最小化來更新動作熵加權因子α,其中,H0表示目標熵,取值為動作維度的相反數-dimat1=-1;步驟4.12:利用更新后的網絡參數繼續循環步驟4.4和步驟4.11,并更新經驗回放池中的樣本;當離線訓練總時間步數大于最長允許充電時間或者當前SOC大于目標SoCref時,執行步驟4.13;步驟4.13:利用經驗回放池中的所有樣本更新μs和σs,執行步驟4.14;步驟4.14:利用更新后的經驗回放池采取步驟4.12;當總訓練輪次達到設定閾值M時,執行步驟4.15;步驟4.15:得到離線訓練完畢后的智能體;步驟5:基于離線訓練完畢的智能體和獎勵函數,并將實體鋰電池作為交互環境,在不同SoH、不同SoC、不同溫度、不同倍率下進行在線測試,輸出最優的安全快速充電策略。

如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人河南科技學院;新鄉市同興智能科技有限公司;有研(廣東)新材料技術研究院,其通訊地址為:453000 河南省新鄉市紅旗區五一路東段;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
主站蜘蛛池模板: 工布江达县| 辉县市| 伽师县| 封丘县| 建宁县| 钟山县| 鲜城| 开封市| 台南市| 金寨县| 定西市| 搜索| 阜南县| 改则县| 昭觉县| 吴堡县| 凯里市| 新野县| 平南县| 阳江市| 宝丰县| 阜阳市| 井陉县| 隆德县| 古蔺县| 明光市| 行唐县| 隆安县| 临邑县| 肇源县| 伊通| 长垣县| 旅游| 马山县| 新昌县| 承德县| 荔浦县| 浑源县| 龙山县| 小金县| 聊城市|