恭喜北京中科凡語科技有限公司翟飛飛獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京中科凡語科技有限公司申請的專利候選實體篩選方法、裝置、可讀存儲介質以及電子設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114970512B 。
龍圖騰網通過國家知識產權局官網在2025-03-21發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210376462.8,技術領域涉及:G06F40/284;該發明授權候選實體篩選方法、裝置、可讀存儲介質以及電子設備是由翟飛飛設計研發完成,并于2022-04-11向國家知識產權局提交的專利申請。
本候選實體篩選方法、裝置、可讀存儲介質以及電子設備在說明書摘要公布了:本公開提供一種候選實體篩選方法,基于訓練集構建觸發詞庫、實體內部構詞規律庫以及標準語義詞性規則庫;對于候選實體,從詞性標注角度出發,對候選實體進行觸發詞與內部構詞特性雙重檢查,確定相似度最高的候選實體。本公開還提供一種候選實體篩選裝置、可讀存儲介質及電子設備。
本發明授權候選實體篩選方法、裝置、可讀存儲介質以及電子設備在權利要求書中公布了:1.一種候選實體篩選方法,其特征在于,包括如下步驟:S1:基于訓練集構建觸發詞庫、實體內部構詞規律庫以及標準語義詞性規則庫;S2:使用所述觸發詞庫中的觸發詞對醫療文本進行實體抽取獲得候選實體集;S3:將模型所標注出的實體與所述候選實體集中的實體進行比較,判斷是否完全一致:完全一致則進入步驟S4,否則進入步驟S6;S4:基于所述標準語義詞性規則庫對步驟S3中完全一致的實體進行詞性標注,利用編輯距離計算該實體的詞性標注組合與所述實體內部構詞規律庫中各詞性組合的語義相似度集合;S5:基于預先設定的語義相似度閾值,判斷所述語義相似度集合中是否存在大于該語義相似度閾值的值:如果存在則該實體正確,結束該實體篩選;S6:將所述候選實體集中的實體與觸發詞組成關鍵語義段,對關鍵語義段分別進行詞性標注;S7:利用編輯距離計算各關鍵語義段與標準語義詞性規則庫中的已有的標準語義段之間的語義相似度,取相似度最高的N個關鍵語義段包含的實體作為待處理實體;以及S8:對所述待處理實體進行詞性標注,利用編輯距離計算待處理實體的詞性標注組合與標準實體規則庫間的語義相似度,確定相似度最高的候選實體;所述觸發詞庫構建通過對訓練集中包含實體的語句進行分詞,按照分詞后實體的上下文信息構建所述觸發詞庫;所述實體內部構詞規律庫通過對于實體進行詞性標注,根據詞性標注結果為實體構建所述實體內部構詞規律庫;所述標準語義詞性規則庫將觸發詞及實體的組合定義為標準語義段,對關鍵語義段進行詞法分析,根據詞法分析結果構建所述標準語義詞性規則庫;所述詞性標注通過單詞自身含義與上下文信息對單詞進行詞性標記,由機器學習算法完成,所述機器學習算法包括隱馬爾可夫模型或條件隨機場。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京中科凡語科技有限公司,其通訊地址為:100190 北京市海淀區知春路63號51號樓10層1006;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。