恭喜北京科杰科技有限公司高經郡獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京科杰科技有限公司申請的專利非結構化文本數據的計算方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119474383B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510076252.0,技術領域涉及:G06F16/35;該發明授權非結構化文本數據的計算方法及系統是由高經郡;高海玲;高松設計研發完成,并于2025-01-17向國家知識產權局提交的專利申請。
本非結構化文本數據的計算方法及系統在說明書摘要公布了:本發明提供非結構化文本數據的計算方法及系統,涉及自然語言處理技術領域,包括對輸入的非結構化文本數據進行多層級處理,根據詞頻分布動態調整分詞粒度,并結合上下文語義信息構建詞性共現矩陣,提取實體信息,融合詞性共現矩陣和實體信息生成層次化語義標簽序列。采用不同卷積核尺寸的特征提取單元提取特征表示,并計算不同語義層次間余弦相似度建立關聯權重矩陣。基于實體信息構建語義增強向量,并進行對抗訓練,得到多模態語義特征矩陣。計算融合特征向量間的語義相似度進行聚類,并根據類簇的復雜度、一致性和模糊度設定難度權重排序后輸入分類器,迭代優化分類結果,得到計算結果。
本發明授權非結構化文本數據的計算方法及系統在權利要求書中公布了:1.非結構化文本數據的計算方法,其特征在于,包括:對輸入的非結構化文本數據進行多層級處理,根據詞頻分布動態調整分詞粒度,結合上下文語義信息構建詞性共現矩陣進行詞性標注,從文本數據中識別并提取實體信息,融合所述詞性共現矩陣和所述實體信息生成層次化語義標簽序列,并對所述層次化語義標簽序列進行大小寫統一和特殊字符替換;采用不同卷積核尺寸的特征提取單元對所述層次化語義標簽序列進行特征提取得到特征表示,通過計算所述特征表示中不同語義層次間的余弦相似度建立關聯權重矩陣,基于所述實體信息的類別屬性和層級關系構建語義增強向量,在所述特征表示中插入預設比例的隨機噪聲生成對抗樣本進行對抗訓練,將訓練后的特征表示、關聯權重矩陣和語義增強向量在特征維度上串聯組合得到多模態語義特征矩陣;計算所述多模態語義特征矩陣中相鄰的融合特征向量的語義相似度得到相似度矩陣,基于所述相似度矩陣對融合特征向量進行聚類得到特征類簇,根據所述特征類簇的結構復雜度、語義一致性和邊界模糊度設定難度權重,將所述特征類簇按照難度權重排序后依次輸入分類器,對每個特征類簇計算類別概率分布和類簇中心距離;采用類簇內樣本對的對比損失構建優化目標,基于所述優化目標對分類器的預測結果進行迭代優化,得到非結構化文本數據的計算結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京科杰科技有限公司,其通訊地址為:100096 北京市海淀區東升科技園北街6號院10號樓11層101;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。