恭喜北京飛瑞星圖科技有限公司楊瑞獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京飛瑞星圖科技有限公司申請的專利基于大模型的長文本信息抽取與關聯分析方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119761382B 。
龍圖騰網通過國家知識產權局官網在2025-06-03發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510263081.2,技術領域涉及:G06F40/30;該發明授權基于大模型的長文本信息抽取與關聯分析方法及系統是由楊瑞;王川;賈川;王旭彬;楊博堯設計研發完成,并于2025-03-06向國家知識產權局提交的專利申請。
本基于大模型的長文本信息抽取與關聯分析方法及系統在說明書摘要公布了:本發明提供一種基于大模型的長文本信息抽取與關聯分析方法及系統,涉及自然語言處理技術領域,包括基于語義密度值確定滑動窗口參數對長文本分塊,提取文本塊特征向量并計算語義相關度,構建層次聚類特征矩陣合并文本塊得到語義片段。之后,對語義片段進行句法分析構建語義依存樹,提取語義網絡并計算實體關系強度值構建語義關聯圖。最后,利用預訓練大模型提取節點特征,通過層次注意力機制融合語義表示,采用自適應圖網絡傳播增強特征,并通過分層決策網絡生成候選路徑,選擇最優路徑并輸出關聯路徑及概率分布。本發明能夠有效地從長文本中提取關鍵信息并分析實體間的關聯關系,提高信息抽取的準確性和效率。
本發明授權基于大模型的長文本信息抽取與關聯分析方法及系統在權利要求書中公布了:1.一種基于大模型的長文本信息抽取與關聯分析方法,其特征在于,包括:接收輸入的長文本,計算長文本的語義密度值,基于密度值確定滑動窗口參數對文本進行分塊處理得到多個文本塊,提取各個文本塊中的詞頻分布矩陣和句法依存樹特征進行張量融合得到文本塊特征向量,計算相鄰文本塊特征向量的語義相關度,構建層次聚類特征矩陣,根據層次聚類特征矩陣合并文本塊得到語義片段;對語義片段進行句法分析構建語義單元,以語義單元為節點構建語義依存樹,從語義依存樹中提取實體節點和實體間關系得到語義網絡,對語義網絡中的實體節點進行上下文特征提取,并通過多頭注意力機制生成實體語義向量,計算實體關系強度值,與語義密度值組合構建語義關聯圖;基于預訓練大模型對語義關聯圖中的實體節點進行多視角特征提取得到節點特征,將節點特征輸入大模型獲取語義表示,將語義表示與實體語義向量融合得到增強特征,采用自適應圖網絡傳播增強特征得到語義關聯特征,輸入分層決策網絡生成候選路徑,對候選路徑進行多粒度編碼得到路徑向量,計算路徑評分選擇最優路徑,通過大模型驗證后輸出關聯路徑及概率分布。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京飛瑞星圖科技有限公司,其通訊地址為:100043 北京市石景山區八角東街65號院主樓北座2號樓9層904;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。