恭喜北京快確信息科技有限公司林遠(yuǎn)平獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜北京快確信息科技有限公司申請的專利基于融合預(yù)訓(xùn)練的文本抽取方法、系統(tǒng)及介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114398855B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-05-06發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210038607.3,技術(shù)領(lǐng)域涉及:G06F40/126;該發(fā)明授權(quán)基于融合預(yù)訓(xùn)練的文本抽取方法、系統(tǒng)及介質(zhì)是由林遠(yuǎn)平;甘偉超;喻廣博;鄒鴻岳;周靖宇設(shè)計(jì)研發(fā)完成,并于2022-01-13向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于融合預(yù)訓(xùn)練的文本抽取方法、系統(tǒng)及介質(zhì)在說明書摘要公布了:本發(fā)明公開了基于融合預(yù)訓(xùn)練的文本抽取方法、系統(tǒng)及介質(zhì),方法包括:獲取待抽取文本;通過預(yù)訓(xùn)練模型對所述待抽取文本進(jìn)行預(yù)訓(xùn)練編碼,得到相應(yīng)的字符向量;選取所述字符向量中的至少部分對鄰近文本進(jìn)行語義提取,并拼接得到語義特征向量;對所述語義特征向量進(jìn)行特征選擇并融合得到有效詞語特征向量;對所述有效詞語特征向量進(jìn)行分流解碼,分別得到詞語分割結(jié)果和實(shí)體識別結(jié)果。通過基于預(yù)訓(xùn)練模型框架進(jìn)行編碼得到字符向量,并且融合字符向量中的至少部分進(jìn)行鄰近文本的語義提取以學(xué)習(xí)文本語義信息,增強(qiáng)語義的學(xué)習(xí)能力,使得最終得到的詞語分割結(jié)果能有效避免邊界模糊的問題,提高文本提取的準(zhǔn)確性。
本發(fā)明授權(quán)基于融合預(yù)訓(xùn)練的文本抽取方法、系統(tǒng)及介質(zhì)在權(quán)利要求書中公布了:1.一種基于融合預(yù)訓(xùn)練的文本抽取方法,其特征在于,包括:獲取待抽取文本;通過預(yù)訓(xùn)練模型對所述待抽取文本進(jìn)行預(yù)訓(xùn)練編碼,得到相應(yīng)的字符向量;選取所述字符向量中的至少部分對鄰近文本進(jìn)行語義提取,并拼接得到語義特征向量;對所述語義特征向量進(jìn)行特征選擇并融合得到有效詞語特征向量;對所述有效詞語特征向量進(jìn)行分流解碼,分別得到詞語分割結(jié)果和實(shí)體識別結(jié)果;所述通過預(yù)訓(xùn)練模型對所述待抽取文本進(jìn)行預(yù)訓(xùn)練編碼,得到相應(yīng)的字符向量之前,所述方法還包括:對所述預(yù)訓(xùn)練模型進(jìn)行對抗訓(xùn)練;所述選取所述字符向量中的至少部分對鄰近文本進(jìn)行語義提取,并拼接得到語義特征向量,包括:選取所述預(yù)訓(xùn)練模型中若干個預(yù)設(shè)位置的編碼層作為目標(biāo)編碼層;將所述目標(biāo)編碼層的輸出結(jié)果分別輸入至一一對應(yīng)連接的文本分類模型中進(jìn)行鄰近文本的語義提取,所述文本分類模型的數(shù)量與目標(biāo)編碼層相同,且各個文本分類模型的內(nèi)核大小不相同;對每個文本分類模型的提取結(jié)果進(jìn)行融合拼接,得到所述語義特征向量;將所述有效詞語特征向量分別輸入至已完成訓(xùn)練的實(shí)體識別任務(wù)層和詞語分割層;通過LSTM網(wǎng)絡(luò)結(jié)構(gòu)對全連接層的輸出進(jìn)行長距離語義特征的提取,將LSTM網(wǎng)絡(luò)結(jié)構(gòu)是輸出結(jié)果作為實(shí)體識別任務(wù)中解碼層的輸入,解碼層采用CRF進(jìn)行實(shí)體標(biāo)簽預(yù)測,最終輸出相應(yīng)的實(shí)體標(biāo)注;通過CRF解碼器對全連接層的輸出進(jìn)行解碼,輸出所述有效詞語特征向量中的字符標(biāo)記,得到詞語分割結(jié)果,所述字符標(biāo)記包括實(shí)體開始標(biāo)記、實(shí)體剩余標(biāo)記以及非實(shí)體標(biāo)記。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京快確信息科技有限公司,其通訊地址為:100000 北京市西城區(qū)阜成門外大街31號4層411D;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜友達(dá)光電股份有限公司裴鍇獲國家專利權(quán)
- 恭喜青島海爾智能技術(shù)研發(fā)有限公司袁珊娜獲國家專利權(quán)
- 恭喜環(huán)球城市電影有限責(zé)任公司P·J·格爾根獲國家專利權(quán)
- 恭喜江蘇宏寶鍛造股份有限公司臧躍東獲國家專利權(quán)
- 恭喜重慶醫(yī)科大學(xué)馮文莉獲國家專利權(quán)
- 恭喜通用技術(shù)集團(tuán)工程設(shè)計(jì)有限公司劉明河獲國家專利權(quán)
- 恭喜北京星河動力航天科技股份有限公司請求不公布姓名獲國家專利權(quán)
- 恭喜南京迦南比遜科技有限公司方正獲國家專利權(quán)
- 恭喜駛帝生命科學(xué)印度私人有限公司I.布山獲國家專利權(quán)
- 恭喜三星顯示有限公司金書妍獲國家專利權(quán)


熱門推薦
- 恭喜中國化工集團(tuán)曙光橡膠工業(yè)研究設(shè)計(jì)院有限公司彭嘯獲國家專利權(quán)
- 恭喜呂孫寶獲國家專利權(quán)
- 恭喜江蘇蘇凈集團(tuán)有限公司梁鳳飛獲國家專利權(quán)
- 恭喜中石化石油工程技術(shù)服務(wù)有限公司楊玉精獲國家專利權(quán)
- 恭喜先健科技(深圳)有限公司江巍獲國家專利權(quán)
- 恭喜安徽博微聯(lián)控科技有限公司楊帥獲國家專利權(quán)
- 恭喜嵊州市浙江工業(yè)大學(xué)創(chuàng)新研究院高增梁獲國家專利權(quán)
- 恭喜深圳市奕通功率電子有限公司徐文輝獲國家專利權(quán)
- 恭喜鄭州輕工業(yè)大學(xué)劉磊獲國家專利權(quán)
- 恭喜貴州興鋰新能源科技有限公司張?zhí)煜楂@國家專利權(quán)