恭喜云南師范大學甘健侯獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜云南師范大學申請的專利一種民族文化信息資源知識圖譜的構建方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN109815340B 。
龍圖騰網通過國家知識產權局官網在2025-05-06發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:201910042744.2,技術領域涉及:G06F16/36;該發明授權一種民族文化信息資源知識圖譜的構建方法是由甘健侯;王俊;周菊香;文斌設計研發完成,并于2019-01-17向國家知識產權局提交的專利申請。
本一種民族文化信息資源知識圖譜的構建方法在說明書摘要公布了:本發明涉及一種民族文化信息資源知識圖譜的構建方法,屬于知識圖譜技術領域。首先利用漢語分詞系統及用戶自定義詞庫對收集到的少數民族大辭典數據中的辭條數據進行分詞和詞性標注,然后對分詞和詞性標注后的辭條數據進行檢測,若連續分詞均為單字的數量不小于設定的閾值,則進行人工分詞操作,并把人工分詞結果添加至漢語分詞系統的用戶自定義詞庫,直到無新詞為止,然后對正確分詞后的辭條數據進行屬性提取,用以構建領域知識圖譜,再次對領域知識圖譜進行重復性檢測,刪除重復數據,將存儲后的領域知識圖譜與資源鏈接,最終進行存儲。
本發明授權一種民族文化信息資源知識圖譜的構建方法在權利要求書中公布了:1.一種民族文化信息資源知識圖譜的構建方法,其特征在于:步驟1:收集少數民族辭條數據,構建少數民族辭條數據庫,利用漢語分詞系統及用戶自定義詞庫對收集到的少數民族辭條數據庫中的辭條數據進行分詞和詞性標注,并去除標點符號;步驟2:然后對分詞和詞性標注后的數據進行檢測,若連續分詞均為單字的數量不小于設定的閾值,則進行人工分詞操作,并把人工分詞結果添加至漢語分詞系統的用戶自定義詞庫,重復步驟1,直到無新詞為止;步驟3:對正確分詞后的數據進行屬性提取,用以構建領域知識圖譜;步驟4:對領域知識圖譜進行重復性檢測,刪除重復數據,進行存儲;步驟5:將存儲后的領域知識圖譜與資源鏈接;所述步驟1和步驟2中的分詞系統為NLPIR漢語分詞系統;所述步驟2中對分詞和詞性標注后的文本數據進行檢測的具體方法為:①定義分詞結果集合SS1,S2,……,Sm;②對集合S中每個分詞結果Si統計字數,得到集合字數結果CC1,C2,……,Cm,其中Ci=lenSi,且1≤i≤m;③設定閾值k,滿足2≤k≤m;④從S中抽取子集合P,P滿足式1和式2 j-i+1≤k<m2說明在S中Si到Sj的位置有連續k個字數為1的分詞,通過設定k值,認為連續的字數為1的分詞是一個新詞x,x={Si,Si+1…Si+k},Si∈S;④定義新詞集合W為W=x1,x2…xn,并對W行人工審核,如果是新詞,添加至用戶自定義詞庫中;所述閾值k設定的方式為從大到小,首次設置時k=m,依次遞減,直到k=1為止,每次閾值設定后重復步驟2,直到將所有新詞添加至用戶自定義詞庫中;所屬步驟4中重復性檢測分為以下幾種類型:類型1:同一實體的同一屬性有多個屬性值,如果某個屬性值包含其他的屬性值,這消除被包含的屬性值;類型2:同一實體的同一屬性有多個屬性值,如果屬性值之間互斥,則根據擁有該屬性值的數量進行判斷,屬性值較多的保留,并提交人工審核;類型3:同一實體的同一屬性有多個屬性值,如果屬性值之間互斥,擁有該屬性值的數量也相同,則完全提交人工審核。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人云南師范大學,其通訊地址為:650500 云南省昆明市呈貢區聚賢街768號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。