重慶大學古富強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉重慶大學申請的專利一種基于雙通道強化學習的敗血癥治療系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115985514B 。
龍圖騰網通過國家知識產權局官網在2025-04-01發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310025880.7,技術領域涉及:G16H50/70;該發明授權一種基于雙通道強化學習的敗血癥治療系統是由古富強;劉會東;張清辰;俞航設計研發完成,并于2023-01-09向國家知識產權局提交的專利申請。
本一種基于雙通道強化學習的敗血癥治療系統在說明書摘要公布了:本發明涉及一種基于雙通道強化學習的敗血癥治療系統,屬于生物醫學技術領域。該系統結合了一個全連接神經網絡和一個長短期記憶神經網絡,其中全連接神經網絡用于捕獲患者當前的生理狀態,長短期記憶神經網絡用于代表患者的治療歷史,包括狀態、行動和獎勵;該系統包括:馬爾可夫決策模塊、雙通道數據流模塊、深度強化學習模塊、離線策略評估模塊;馬爾可夫決策模塊將整個疾病治療過程構建為馬爾可夫決策過程,選擇患者的歷史治療病歷構建強化學習模型的輸入數據庫,包括狀態值、動作值和獎勵函數。與現有技術相比,本系統通過學習患者的歷史和當前時刻的生理信息,可以更好的捕獲患者生理特征的動態變化,豐富尋找最優策略的學習過程,性能更優。
本發明授權一種基于雙通道強化學習的敗血癥治療系統在權利要求書中公布了:1.一種基于雙通道強化學習的敗血癥治療系統,其特征在于:該系統結合了一個全連接神經網絡和一個長短期記憶神經網絡,其中全連接神經網絡用于捕獲患者當前的生理狀態,長短期記憶神經網絡用于代表患者的治療歷史,包括狀態、行動和獎勵;該系統具體包括:馬爾可夫決策模塊、雙通道數據流模塊、深度強化學習模塊、離線策略評估模塊;所述馬爾可夫決策模塊將整個疾病治療過程構建為馬爾可夫決策過程,選擇患者的歷史治療病歷構建強化學習模型的輸入數據庫,包括狀態值、動作值和獎勵函數;所述雙通道數據流模塊選取多個批次的數據,并將當前時刻的狀態值輸入到全連接神經網絡中,上一個時刻的狀態值、動作值和獎勵值輸入到長短期記憶神經網絡中,來構建雙通道數據流機制;所述深度強化學習模塊進行決策學習,通過輸入雙通道數據流模塊數據,更好捕獲患者每一時刻的生理狀態變化;所述離線策略評估模塊對深度強化學習模塊的策略進行評估,減少Q值方差較大的影響,并對于測試集中的每個患者的軌跡,計算學習策略的值和平均結果的無偏估計;所述馬爾可夫決策模塊將整個疾病治療過程構建為馬爾可夫決策過程,選擇患者的歷史治療病歷構建強化學習模型的輸入數據庫,包括狀態值、動作值和獎勵函數;其中狀態值是收集患者在治療每一時刻的48維生理特征,動作值是靜脈輸液IV和最大血管加壓藥VP的聯合使用,在給定的4小時窗口內將IV和VP分散到5個箱子中,得到一個5×5的離散動作空間,獎勵函數是使用順序器官衰竭評估評分和患者乳酸水平作為強化學習優化的中間目標,以跟蹤患者隨時間的生理健康變化,同時在整個治療結束對生存患者添加+15的獎勵,對死亡患者添加-15的獎勵;所述本系統使用的數據是患者的治療病歷,分別提取患者每一時刻的生理特征信息、治療策略和對應的生理指標變化值如連續性器官衰竭評估值和乳酸水平,構建狀態值s,動作值a和獎勵函數r;所述獎勵函數定義如下: 其中和表示t時刻的SOFA評分和乳酸水平,C0=-0.025,C1=-0.125,C2=-2;對于最終獎勵,對最終存活的患者使用+15正獎勵,對死亡患者使用-15負獎勵;所述雙通道數據流模塊,用于從患者當前和歷史的治療決策信息序列中學習最佳的治療策略,具體來說,使用全連接神經網絡來學習患者的當前狀態,使用長短期記憶神經網絡來學習在t-1時刻的生理信息,最后,將兩個網絡的輸出作為最終Q值;假設在t時刻,狀態為st,動作為at,獎勵函數為rt,則雙通道DRL的Q值為: 其中θ和μ分別表示全連接神經網絡和長短期記憶神經網絡的權值參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人重慶大學,其通訊地址為:400030 重慶市沙坪壩區沙正街174號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。