恭喜之江實驗室閆皓哲獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜之江實驗室申請的專利一種基于大語言模型的文獻內容抽取方法和系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119166742B 。
龍圖騰網通過國家知識產權局官網在2025-05-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411655249.6,技術領域涉及:G06F16/31;該發明授權一種基于大語言模型的文獻內容抽取方法和系統是由閆皓哲;張君蘭;周順祥;單利群;魏淑萍設計研發完成,并于2024-11-19向國家知識產權局提交的專利申請。
本一種基于大語言模型的文獻內容抽取方法和系統在說明書摘要公布了:本發明提供了一種基于大語言模型的文獻內容抽取方法和系統,旨在提高科研效率,降低科研文獻閱讀耗費的時間成本。該方法包括:將需要抽取的文獻上傳至系統并進行格式化處理,形成結構化的數據內容;選擇需要抽取的類型,創建抽取屬性集合及確定屬性關系;調用大語言模型及抽取算法,獲得抽取的屬性關鍵基礎數據;識別適配抽取到的數據并進行規整組合;將規整組合好的數據進行二維展示并保存記錄;對二維行列組合的數據進行自定義局部保存。本發明主要用于解決科研文獻的批量關鍵信息提取,幫助科研人員快速提煉文獻內容和數據,提升科研效率。
本發明授權一種基于大語言模型的文獻內容抽取方法和系統在權利要求書中公布了:1.一種基于大語言模型的文獻內容抽取方法,其特征在于,包括以下步驟:步驟一:對文獻內容進行格式化處理,形成結構化數據視圖;步驟二:基于所述步驟一得到的結構化數據視圖,選擇目標文獻的抽取方式;所述抽取方式包括表格抽取、基礎抽取和自定義屬性抽取;所述表格抽取為:直接提取文獻中的表格數據,并以latex語言輸出;所述基礎抽取為:執行固定輸入參數,提取文獻中的基礎元數據信息,包括作者、年代、摘要、論點、結論、討論方向;所述自定義屬性抽取為:輸入屬性定義和屬性關系;其中,屬性定義包括屬性名稱、屬性描述、屬性類型、屬性提示詞;屬性關系用于確定屬性間的父子關系,若沒有指定父屬性,則采用同級屬性策略抽取;步驟三:根據所述步驟二選擇的抽取方式,調用大語言模型中的抽取算法進行文獻內容的抽取;步驟四:將所述步驟三抽取的數據進行展示;步驟五:將所述步驟四展示的數據全量保存為記錄,或根據用戶自定義保存成歸檔數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人之江實驗室,其通訊地址為:311121 浙江省杭州市余杭區中泰街道科創大道之江實驗室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。