恭喜浙江大學呂旭東獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜浙江大學申請的專利基于多輪問答的CT影像報告信息抽取方法、裝置、計算機設備和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114360677B 。
龍圖騰網通過國家知識產權局官網在2025-04-01發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111544922.5,技術領域涉及:G16H15/00;該發明授權基于多輪問答的CT影像報告信息抽取方法、裝置、計算機設備和存儲介質是由呂旭東;胡丹青;章宦耀;段會龍設計研發完成,并于2021-12-16向國家知識產權局提交的專利申請。
本基于多輪問答的CT影像報告信息抽取方法、裝置、計算機設備和存儲介質在說明書摘要公布了:本發明公開了一種基于多輪問答的CT影像報告信息抽取方法、裝置、計算機設備和存儲介質,包括:1根據信息抽取任務預設頭實體問答問題和尾實體問答問題模板;2基于閱讀理解框架構建并優化信息抽取模型;3將從提取CT影像報告中提取的句子與每條頭實體問答問題拼接,得到提取頭實體所需的輸入文本,并輸入到訓練好的信息提取模型得到頭實體;隨后,將頭實體與尾實體問答問題模板拼接,得到針對頭實體的尾實體問答問題,并將其與句子拼接得到提取尾實體所需的輸入文本,將輸入文本輸入到訓練好的信息提取模型中得到尾實體;5將得到的頭實體和尾實體配對成三元組,并將提取的三元組信息進行標準化后輸出。
本發明授權基于多輪問答的CT影像報告信息抽取方法、裝置、計算機設備和存儲介質在權利要求書中公布了:1.一種基于多輪問答的CT影像報告信息抽取方法,其特征在于,包括以下步驟:步驟1,根據信息抽取任務預設問答模板,包括頭實體問答問題和尾實體問答問題模板,其中信息抽取任務為抽取主體以及主體的相關內容,相關內容為主體的相關屬性或者主體的相關處理方式,并將主體認為是頭實體,圍繞頭實體構建頭實體問答問題,認為主體的相關內容為尾實體,圍繞該尾實體構建尾實體問答問題模板,信息抽取任務具體為對肺部CT影像報告中肺癌分期信息進行抽取;步驟2,基于閱讀理解框架構建信息抽取模型,其中閱讀理解框架包括BiLSTM、GRU、BERT、GPT或XLNET;步驟3,在信息抽取模型訓練階段,首先,利用分句算法提取CT影像報告中的每條句子;然后,將句子與每條頭實體問答問題拼接,得到提取頭實體所需的輸入文本;隨后,根據人工標注的頭實體金標準數據,與對應的每條尾實體問答問題模板拼接,形成針對該頭實體的尾實體問答問題,再將該尾實體問答問題與句子拼接,得到提取尾實體所需的輸入文本,構建數據集,將數據集分為訓練集、驗證集以及測試集;在監督下,利用訓練集訓練閱讀理解框架,以優化閱讀理解框架參數,參數優化后的閱讀理解框架作為信息抽取模型;在模型訓練的每次迭代中,利用驗證集對信息抽取模型進行評估,以得到F1-marco,如果F1-marco值比之前全局最佳F1-marco值要好,更新全局最佳F1-marco值,同時保存信息抽取模型,直到訓練結束,取得全局最佳F1-marco值的模型作為最終的信息抽取模型;步驟4,在信息抽取模型測試階段,首先利用分句算法提取CT影像報告中的每條句子;然后,將句子與每條頭實體問答問題拼接,得到提取頭實體所需的輸入文本,將文本輸入到訓練好的信息提取模型中得到頭實體,作為第一輪問答結果;隨后,利用提取到的頭實體與尾實體問答問題模板拼接,得到針對該頭實體的尾實體問答問題,再將該尾實體問答問題與句子拼接,得到提取尾實體所需的輸入文本,將文本再次輸入到訓練好的信息提取模型中得到尾實體,作為第二輪問答結果,如果從句子中不能抽取到尾實體問題的答案,則第二抽取任務結束,通過第一輪的頭實體問題的頭實體將第一輪和第二輪關聯起來,最大程度利用兩輪的信息,使得頭實體和尾實體具有很強的關聯性;步驟5,將多輪問答提取到的頭實體和尾實體配對成三元組,并將提取的三元組信息進行標準化后輸出。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。