恭喜廈門淵亭信息科技有限公司洪萬福獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜廈門淵亭信息科技有限公司申請的專利基于先驗圖譜的大模型檢索方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119357366B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411930729.9,技術領域涉及:G06F16/3329;該發明授權基于先驗圖譜的大模型檢索方法、裝置、設備及存儲介質是由洪萬福;顏立全;施清爽設計研發完成,并于2024-12-26向國家知識產權局提交的專利申請。
本基于先驗圖譜的大模型檢索方法、裝置、設備及存儲介質在說明書摘要公布了:本發明提供了一種基于先驗圖譜的大模型檢索方法、裝置、設備及存儲介質,通過獲取用戶輸入的問句,對問句進行重構以生成問題集合,并提取問題集合中每一子問題的核心關鍵詞;接著,基于核心關鍵詞生成檢索語句,并根據檢索語句從先驗圖譜數據庫中提取相關節點;接著,根據相關節點的節點ID生成元數據篩選條件,并根據元數據篩選條件和相似度從預先構建的向量數據庫中選取預設數量的向量庫文檔,最后,基于問題集合中每一子問題相對應的多個向量庫文檔進行排序,并通過截斷算法對排序后的多個向量庫文檔進行截斷,將處理后的文檔按節點ID進行分組,并將同一節點的信息合成為完整文檔。解決了RAG技術在檢索過程中可能出現遺漏或不相關的內容。
本發明授權基于先驗圖譜的大模型檢索方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種基于先驗圖譜的大模型檢索方法,其特征在于,包括:獲取用戶輸入的問句,對所述問句進行重構以生成問題集合,并提取所述問題集合中每一子問題的核心關鍵詞;基于所述核心關鍵詞生成檢索語句,并根據所述檢索語句從先驗圖譜數據庫中提取相關節點;根據所述相關節點的節點ID生成元數據篩選條件,并根據所述元數據篩選條件和相似度從預先構建的向量數據庫中選取預設數量的向量庫文檔,其中,所述向量數據庫的生成過程為:基于cypher查詢語句從所述先驗圖譜數據庫中提取節點數據,并對所述節點數據進行基礎屬性和額外屬性劃分,基于所述基礎屬性生成的第一文檔和基于所述額外屬性和所述額外屬性關聯的節點生成的第二文檔,對所述第一文檔和所述第二文檔進行添加元數據后保存在向量數據庫內;基于所述問題集合中每一子問題相對應的多個所述向量庫文檔進行排序,并通過截斷算法對排序后的多個所述向量庫文檔進行截斷,將處理后的文檔按節點ID進行分組,并將同一節點的信息合成為完整文檔,具體為:對待處理文檔按節點唯一標識進行分組,遍歷已排序的文檔,檢查每個文檔的節點唯一標識是否已被處理過;對于未處理過的文檔,根據節點類型生成文檔內容,其中:對于普通節點,使用節點的基本屬性和標簽生成文檔內容;對于關系節點,根據不同情況生成文檔,具體為:若存在關系信息,先生成描述關系的文檔,再生成描述屬性的文檔;若節點組中已有屬性文檔,則先生成屬性文檔,再生成關系文檔;若無屬性文檔,直接生成關系文檔;其中,生成文檔的過程中,使用節點的關系類型和基本屬性構建描述性文本,并在處理每個文檔后,記錄其節點唯一標識,其中,所述截斷算法的表達式為: 其中,為當前的動態截斷閾值,為當前文檔分數,為當前文檔分數賦予的權重,i為當前處理的文檔在排序中的位置。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門淵亭信息科技有限公司,其通訊地址為:361000 福建省廈門市軟件園二期望海路61號801單元N8-01;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。