恭喜廣西警察學院秦振凱獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜廣西警察學院申請的專利一種基于深度學習的醫療實體識別與關系抽取方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119167938B 。
龍圖騰網通過國家知識產權局官網在2025-05-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411393643.7,技術領域涉及:G06F40/295;該發明授權一種基于深度學習的醫療實體識別與關系抽取方法是由秦振凱;向秋焱;周勝;徐銘朝;梁家權;朱鋒設計研發完成,并于2024-10-08向國家知識產權局提交的專利申請。
本一種基于深度學習的醫療實體識別與關系抽取方法在說明書摘要公布了:本發明公開了一種基于深度學習的醫療實體識別與關系抽取方法,S1、獲取并預處理醫療文本數據集;S2、構建醫療領域的詞嵌入模型;S3、基于所述詞嵌入模型,構建并訓練采用Attention機制的多層神經網絡模型;S4、將經過訓練的多層神經網絡模型應用于新的醫療文本數據集,對醫療文本數據集中的實體進行識別和分類;S5、在識別出實體后,使用雙向Attention機制對醫療文本數據集中的實體進行關系抽取;S6、針對不同類型的關系,使用雙向Attention機制分別進行處理;S7、結合醫療領域知識庫,對識別出的實體和關系進行驗證與補充;S8、將最終識別和抽取的醫療實體及其關系以結構化形式輸出。本發明提升了醫療文本分析的可靠性和實用性。
本發明授權一種基于深度學習的醫療實體識別與關系抽取方法在權利要求書中公布了:1.一種基于深度學習的醫療實體識別與關系抽取方法,其特征在于,包括如下步驟:S1、獲取并預處理醫療文本數據集,對醫療文本數據集進行分詞、去停用詞及標準化處理;S2、構建醫療領域的詞嵌入模型,利用醫療領域的術語詞典和語料庫對詞嵌入模型進行訓練,使詞嵌入模型生成醫療術語的高維向量表示;S3、基于所述詞嵌入模型,構建并訓練采用Attention機制的多層神經網絡模型;S4、將經過訓練的多層神經網絡模型應用于新的醫療文本數據集,對醫療文本數據集中的實體進行識別和分類;S5、在識別出實體后,使用雙向Attention機制對醫療文本數據集中的實體進行關系抽取,關系抽取包括識別實體之間的直接關系及通過上下文感知推斷的潛在關聯關系;S6、針對不同類型的關系,使用雙向Attention機制分別進行處理;S7、結合醫療領域知識庫,對識別出的實體和關系進行驗證與補充;S8、將最終識別和抽取的醫療實體及其關系以結構化形式輸出;所述S7具體包括:S71、將識別出的實體集合E={e1,e2,...,en}和實體關系集合R={r1,r2,...,rm}與醫療領域知識庫Kmed進行匹配,知識庫Kmed包括標準醫學術語、疾病分類編碼和藥物數據庫,定義實體匹配評分Smatchei: 其中,Kk為知識庫中的第k條醫學術語或實體記錄,δei,Kk為二值函數,當實體ei與知識庫中的實體Kk匹配時,δei,Kk=1,否則為0,l為知識庫中與實體ei匹配的條目總數;S72、根據實體匹配評分Smatchei對低匹配的實體ei進行補充驗證,從知識庫Kmed中檢索與其語義相近的實體,計算實體相似度評分Ssimei,Kk: 其中,和分別為實體ei和知識庫中實體Kk的詞向量表示,cos表示詞向量間的余弦相似度;S73、針對識別出的關系集合R計算每對實體關系rj=ei,ek的關系匹配評分Smatchrj:Smatchrj=λ6·Relmedei,ek;其中,Relmedei,ek為醫療知識庫中與實體ei和實體ek之間關系的向量表示,λ6為調節系數,控制知識庫對關系驗證的影響;S74、結合上下文感知生成的最終關系預測值Rij與關系匹配評分Smatchrj進行對比,當最終關系預測值Rij與匹配評分之間的差異超過預設閾值時,使用知識庫中的語義信息進行關系驗證與補充;S75、輸出經過知識庫驗證和補充后的醫療實體集合和醫療關系集合: 其中,和為經過驗證補充后的醫療實體與醫療關系。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣西警察學院,其通訊地址為:530028 廣西壯族自治區南寧市青秀區長湖路6號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。