恭喜北京理工大學李昌赫獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京理工大學申請的專利一種基于圖表示學習的知識圖譜跨語言對齊方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114443855B 。
龍圖騰網通過國家知識產權局官網在2025-05-06發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210020693.5,技術領域涉及:G06F16/36;該發明授權一種基于圖表示學習的知識圖譜跨語言對齊方法是由李昌赫;張華平;商建云設計研發完成,并于2022-01-10向國家知識產權局提交的專利申請。
本一種基于圖表示學習的知識圖譜跨語言對齊方法在說明書摘要公布了:本發明涉及一種基于圖表示學習的知識圖譜跨語言對齊方法,屬于自然語言處理技術領域。在知識圖譜構建階段,通過爬取網站數據作為來源。然后,過濾篩選多語言實體并抽取其結構化數據組成三元組,構建知識圖譜。在對齊階段,通過圖表示學習,將不同來源的知識圖譜生成對應的嵌入矩陣,在圖嵌入基礎上,依靠已對齊實體,將不同語言知識圖譜中的實體合并到統一的空間中,并根據實體在聯合語義空間中的距離進行對齊。本方法充分利用了知識圖譜結構信息,通過圖表示學習方法將不同語言知識圖譜中的實體合并到統一的空間中,并根據實體在聯合語義空間中的距離進行對齊,保證了融合后的數據更準確全面,提高了在跨語言領域進行快速分析和智能搜索的效率。
本發明授權一種基于圖表示學習的知識圖譜跨語言對齊方法在權利要求書中公布了:1.一種基于圖表示學習的知識圖譜跨語言對齊方法,其特征在于,包括以下步驟:步驟1:獲取多語言數據,包括以下步驟:首先,爬取百科類多語言網站數據,并以html格式存到本地;然后,對爬取到的數據進行分類,去除臟數據;步驟2:解析根據步驟1得到的html格式的多語言數據,處理成三元組類型的json格式數據;步驟3:根據步驟2得到的json格式數據建立多語言知識圖譜,包括以下步驟:步驟3.1:針對爬到的不同來源的數據建立索引;步驟3.2:根據步驟3.1建立的索引,對不同來源的數據分別構建知識圖譜;第一步:根據步驟2得到的json格式數據文件,遍歷每種語言數據的三元組,得到其頭節點、關系、尾節點;第二步:根據第一步得到的頭節點、關系和尾節點,針對數據實體名稱建立字段,得到每種語言數據的全部屬性信息;第三步:根據步驟3.1建立的索引,找到不同來源的數據,對于同一來源的數據,利用py2neo庫進行標記,并將第二步得到的數據導入關系型數據庫Neo4j,根據不同數據源和語種,分別建立知識圖譜;步驟4:根據步驟3得到的不同來源的多語言知識圖譜,嵌入到統一的向量空間,包括以下步驟:步驟4.1:關系嵌入,其中,對于由步驟3得到的每種不同來源的知識圖譜,都分別進行關系嵌入;步驟4.2:嵌入空間變換,方法如下:第一步:隨機初始化網絡的權重矩陣M;第二步:將步驟2中得到的種子對齊實體和根據步驟4.1得到的各種不同來源的知識圖譜的關系嵌入表達輸入到全連接層中,訓練矩陣M;第三步:根據第二步得到的矩陣M,將不同來源的知識圖譜編碼進一個統一的嵌入空間中;步驟5:在向量空間中計算實體之間的距離并對齊。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京理工大學,其通訊地址為:100081 北京市海淀區中關村南大街5號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。