恭喜洛陽師范學院馬友忠獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜洛陽師范學院申請的專利基于距離劃分樹的高維數據相似性連接查詢方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN108829804B 。
龍圖騰網通過國家知識產權局官網在2025-05-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:201810577221.3,技術領域涉及:G06F16/2453;該發明授權基于距離劃分樹的高維數據相似性連接查詢方法及裝置是由馬友忠;張瑞玲;林春杰;李瑩設計研發完成,并于2018-06-05向國家知識產權局提交的專利申請。
本基于距離劃分樹的高維數據相似性連接查詢方法及裝置在說明書摘要公布了:本發明實施例提供一種基于距離劃分樹的高維數據相似性連接查詢方法及裝置。方法包括獲取高維的原始數據,并將原始數據映射到一維空間;根據第一距離閾值及卡方分布性質確定第二距離閾值,根據原始數據和第二距離閾值構建距離劃分樹;遍歷距離劃分樹并對距離劃分樹中的各節點進行比較獲得候選相似節點對集合;計算候選相似節點對集合中各候選相似節點對包括的原始數據之間的原始距離,并將原始距離與第一距離閾值進行比較獲得相似性查詢結果。裝置用于執行方法,本發明實施例通過將高維原始數據映射到一維空間降低了計算的復雜度,通過距離劃分樹可以以較低的代價找到候選結果,增強了過濾效果,從而大大提高查詢效率。
本發明授權基于距離劃分樹的高維數據相似性連接查詢方法及裝置在權利要求書中公布了:1.一種基于距離劃分樹的高維數據相似性連接查詢裝置,其特征在于,用于從高維數據集合中查詢數據間的相似性,所述高維數據集合中的數據為圖形圖像、視頻、軌跡或時間序列,所述裝置包括:映射模塊,用于獲取所有待查詢的高維的原始數據,并將所述原始數據映射到一維空間;距離劃分樹構建模塊,用于根據預設的第一距離閾值及卡方分布性質確定第二距離閾值,根據所述一維空間中的所述原始數據和所述第二距離閾值構建距離劃分樹;候選相似節點對集合獲取模塊,用于遍歷所述距離劃分樹,并對所述距離劃分樹中的各節點進行比較,獲得候選相似節點對集合;比較模塊,用于計算所述候選相似節點對集合中各候選相似節點對包括的原始數據之間的原始距離,并將所述原始距離與所述第一距離閾值進行比較,獲得相似性查詢結果;其中,所述映射模塊具體用于:將所述原始數據v與a進行點積運算,進而將所述原始數據映射到一維空間,其中,向量a的每一個元素都服從標準正態分布N0,1的獨立、同分布隨機變量;所述距離劃分樹構建模塊,具體用于:從所述原始數據中隨機獲取原始數據子集,根據所述原始數據子集構建對應的初始距離劃分樹;對所述初始距離劃分樹按照預設規則進行擴展,獲得所述距離劃分樹;其中,所述預設規則包括:對所述初始距離劃分樹中的第一層子節點進行擴展;若所述初始距離劃分樹中的第一層最左邊子節點的編號大于1,則生成一個虛擬子節點;在所述初始距離劃分樹中的第一層最右邊生成一個虛擬子節點;若判斷獲知所述初始距離劃分樹中的第一層的所述子節點的編號非連續,則在非連續編號的兩個子節點中間生成一個虛擬子節點;所述距離劃分樹構建模塊,具體用于:根據所述原始數據子集構建根節點;將所述原始數據子集映射到一維空間,并根據所述第二距離閾值對所述一維空間進行等寬劃分,獲得所述根節點對應的多個子節點;計算各原始數據子集在所述一維空間的映射值π1vi,根據所述映射值和所述第二距離閾值計算各原始數據對應的所述子節點的編號:其中ε為所述第一距離閾值;若判斷獲知所述子節點的編號不存在,則生成對應編號的新子節點;如果已經存在,則將vi插入到節點pid中,并將數量count值增加1;若判斷獲知所述子節點中所述原始數據子集的個數大于預設閾值,則根據所述子節點的距離范圍對所述子節點進行再次劃分,直至所述子節點中的原始數據子集的個數小于或等于所述預設閾值,獲得初始距離劃分樹;距離劃分樹節點的數據結構為:在距離劃分樹中每一個節點,包括父親節點和葉子節點,都包含有該節點所在level,層內編號orderNo,數據個數count和對應的數據集合。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人洛陽師范學院,其通訊地址為:471000 河南省洛陽市伊濱區吉慶路6號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。