恭喜中國石油大學(華東)張衛山獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜中國石油大學(華東)申請的專利一種基于提示學習的實體和/或關系鏈接方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115129893B 。
龍圖騰網通過國家知識產權局官網在2025-04-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210787603.5,技術領域涉及:G06F16/36;該發明授權一種基于提示學習的實體和/或關系鏈接方法是由張衛山;孫晨瑜;侯召祥;王振琦;陳濤;陳炳陽;李曉哲;公凡奎設計研發完成,并于2022-07-06向國家知識產權局提交的專利申請。
本一種基于提示學習的實體和/或關系鏈接方法在說明書摘要公布了:本發明提供了一種基于提示學習的實體和或關系鏈接方法,在實體消歧方法基礎上引入提示學習,包括以下步驟:將問答系統生成的SPARQL進行預處理,并進行子句劃分,判斷SPARQL子句類型,并選擇性進行后續步驟;通過BM25字符級短文本匹配算法實現實體召回,設計基于提示學習的實體和或關系鏈接方法,對SPARQL提及的實體與召回實體進行鏈接;根據獲得正確實體,在知識庫中查詢出實體相關的關系作為召回關系,使用上述過程中實體和或關系鏈接方法,對SPARQL提及的關系與召回關系進行鏈接;根據鏈接結果對SPARQL進行修訂。本發明在傳統實體消歧方法基礎上引入提示學習,使實體消歧模型可以同時用于實體和關系鏈接,對生成的SPARQL查詢進行修訂,提高了問答系統的準確率。
本發明授權一種基于提示學習的實體和/或關系鏈接方法在權利要求書中公布了:1.一種基于提示學習的實體和或關系鏈接方法,其特征在于,在現有的實體消歧方法基礎上引入提示學習,并包括以下步驟:S1,將問答系統生成的SPARQL進行預處理,并進行子句劃分,判斷SPARQL子句類型;若為subject?xobject類型,則需要進行步驟S2和步驟S4,若為subjectpredicate?x形式,則需要進行步驟S2、步驟S3和步驟S4;通過正則表達式將長SPARQL分割為短SPARQL子句,并判斷子句類型,具體為:S11,將生成的SPARQL按照字符“.”進行正則分割,得到多個子SPARQL語句;S12,使用正則判斷子句中“?x”的位置,若“?x”位于子句末尾,則判斷為subjectpredicate?x類型,否則為subject?xobject類型;S2,通過BM25字符級短文本匹配算法實現實體召回,設計基于提示學習的實體和或關系鏈接方法,對SPARQL提及的實體與召回實體進行鏈接;將實體消歧任務看做二分類任務,設計基于提示學習的實體和或關系鏈接方法,具體為:S21,提取子SPARQL中的實體,將實體通過BM25字符級短文本匹配算法與知識庫中每個節點計算相似度,并根據該相似度排序,選擇相似度最高的n個實體作為候選實體集,記為,實現實體召回;S22,使用基于提示學習的實體消歧模型,選出最契合的知識庫實體,實現實體消歧;將步驟S21獲取的候選實體、輸入的問題Q和步驟S21中獲取的實體進行拼接,使用[SEP]作為分隔符,并在最后嵌入提示參數以及標記作為模型輸入,記為T,公式如下: 將實體消歧任務看做二分類任務,即與為同一實體或非同一實體,提示學習的Answer標簽表示為“是”、“否”兩大類;將T作為輸入,RoBERTa作為實體消歧的基模型進行任務建模,負責進行語義信息提取,通過MLM任務生成[MASK]位置所對應的字符,最后對生成的字符進行答案映射,得到二分類結果;S23,根據步驟S22得到的二分類結果,利用Softmax函數計算概率值;對標簽為“是”的所有實體按照概率排序,選擇概率最大的作為實體鏈接結果,替換subject錯誤實體;S3,根據S2獲得的正確實體,在知識庫中查詢出實體相關的關系作為召回關系,使用S2中的實體和或關系鏈接方法,對SPARQL提及的關系與召回關系進行鏈接;S4,根據實體和或關系鏈接結果,對SPARQL進行修訂。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國石油大學(華東),其通訊地址為:266000 山東省青島市黃島區長江西路66號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。