恭喜騰訊科技(深圳)有限公司吳東華獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜騰訊科技(深圳)有限公司申請的專利一種基于位置信息的文本識別方法以及相關裝置獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN113590832B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-05-27發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202110090663.7,技術領域涉及:G06F16/36;該發(fā)明授權一種基于位置信息的文本識別方法以及相關裝置是由吳東華設計研發(fā)完成,并于2021-01-22向國家知識產(chǎn)權局提交的專利申請。
本一種基于位置信息的文本識別方法以及相關裝置在說明書摘要公布了:本申請公開了一種基于位置信息的文本識別方法以及相關裝置,應用于人工智能的自然語言處理技術。通過獲取目標文本,目標文本包括多個文本單元;然后將目標文本輸入文本識別模型中的特征提取層,以得到各個文本單元對應的文本特征向量;基于關鍵詞詞典確定各個文本單元在目標文本中對應的位置權重;進而將位置權重和文本特征向量輸入文本識別模型中的輸出層,以得到識別結果。從而實現(xiàn)將位置信息與特征信息相融合的文本識別過程,由于位置信息可以補充短文本中上下文信息的不足,彌補了模型側對于上下文信息學習的不充分,提升了文本識別的準確性。
本發(fā)明授權一種基于位置信息的文本識別方法以及相關裝置在權利要求書中公布了:1.一種基于位置信息的文本識別方法,其特征在于,包括:獲取目標文本,所述目標文本包括多個文本單元;將所述目標文本輸入文本識別模型中的特征提取層,以得到各個所述文本單元對應的文本特征向量;基于關鍵詞詞典確定各個所述文本單元在所述目標文本中對應的位置權重;所述關鍵詞詞典用于指示不同文本品類下的領域詞;所述文本單元與所述目標文本對應的領域詞在所述目標文本中的位置越近,所述文本單元在所述目標文本中對應的位置權重越大;將所述位置權重和所述文本特征向量輸入所述文本識別模型中的輸出層,以得到識別結果;所述關鍵詞詞典是采用如下方式得到的:獲取不同預設品類下語料數(shù)據(jù),并確定多個候選詞;確定所述候選詞在所述預設品類中的領域特征值;基于所述領域特征值對所述候選詞進行篩選,以得到不同的所述預設品類對應的領域詞典;對不同的所述預設品類對應的領域詞典進行融合,以得到所述關鍵詞詞典。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518057 廣東省深圳市南山區(qū)高新區(qū)科技中一路騰訊大廈35層;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。