恭喜東南大學(xué)楊鵬獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜東南大學(xué)申請(qǐng)的專利一種融合句法結(jié)構(gòu)信息的關(guān)鍵詞生成方法及裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN114692605B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-05-06發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202210415569.9,技術(shù)領(lǐng)域涉及:G06F40/284;該發(fā)明授權(quán)一種融合句法結(jié)構(gòu)信息的關(guān)鍵詞生成方法及裝置是由楊鵬;戈妍妍;方海生;于曉潭設(shè)計(jì)研發(fā)完成,并于2022-04-20向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種融合句法結(jié)構(gòu)信息的關(guān)鍵詞生成方法及裝置在說明書摘要公布了:本發(fā)明公開了一種融合句法結(jié)構(gòu)信息的關(guān)鍵詞生成方法及裝置,能夠?yàn)樾侣勎恼伦詣?dòng)地生成關(guān)鍵詞。本發(fā)明首先使用爬蟲工具采集新聞文章,并采取人工標(biāo)注參考關(guān)鍵詞構(gòu)造出新聞文章數(shù)據(jù)集;然后對(duì)文本進(jìn)行預(yù)處理,依存句法分析和過濾停用詞;接著基于循環(huán)神經(jīng)網(wǎng)絡(luò)的順序編碼器和基于圖卷積網(wǎng)絡(luò)的圖編碼器分別獲取文章的上下文語義和結(jié)構(gòu)特征,并利用聚類方法將文本分為包含不同子主題部分,并利用多個(gè)基于注意力機(jī)制的解碼器并行生成關(guān)鍵詞;采樣交叉熵?fù)p失進(jìn)行模型參數(shù)優(yōu)化;最后基于訓(xùn)練后的模型對(duì)待處理的新聞文章進(jìn)行自動(dòng)關(guān)鍵詞生成。本發(fā)明通過句法結(jié)構(gòu)信息彌補(bǔ)順序編碼存在的長(zhǎng)距離單詞依賴信息損失問題,從而提高生成關(guān)鍵詞的質(zhì)量。
本發(fā)明授權(quán)一種融合句法結(jié)構(gòu)信息的關(guān)鍵詞生成方法及裝置在權(quán)利要求書中公布了:1.一種融合句法結(jié)構(gòu)信息的關(guān)鍵詞生成方法,其特征在于,包括如下步驟:步驟1:新聞文章采集通過爬蟲工具收集多個(gè)媒體平臺(tái)的新聞文章,積累樣本數(shù)據(jù)集,然后對(duì)樣本數(shù)據(jù)集進(jìn)行過濾以減少樣本重復(fù)率;對(duì)樣本集中每一個(gè)樣本采用人工標(biāo)注構(gòu)造訓(xùn)練樣例:新聞文章和標(biāo)準(zhǔn)關(guān)鍵詞;步驟2:文本預(yù)處理對(duì)文章進(jìn)行分句、分詞,利用句法依存分析工具得到句法分析結(jié)果;其次根據(jù)句法分析結(jié)構(gòu)構(gòu)造句法圖,將文本單詞映射為圖中節(jié)點(diǎn),單詞之間的關(guān)系通過邊體現(xiàn);步驟3:訓(xùn)練基于句法結(jié)構(gòu)信息融合的關(guān)鍵詞生成模型首先通過順序編碼和結(jié)構(gòu)編碼雙編碼方式學(xué)習(xí)單詞表示;然后子圖聚類網(wǎng)絡(luò)根據(jù)整個(gè)文本的含義,對(duì)文本內(nèi)容進(jìn)行劃分,從而為每個(gè)解碼器構(gòu)建獨(dú)特的子主題表示;之后帶注意力機(jī)制的順序解碼器根據(jù)生成的子主題表示生成相應(yīng)的關(guān)鍵詞;最后利用交叉熵作為損失函數(shù)對(duì)模型參數(shù)進(jìn)行優(yōu)化;包括如下子步驟:子步驟3-1,構(gòu)建輸入層;子步驟3-2,構(gòu)建文本編碼層;子步驟3-3,構(gòu)建子圖生成層,在文本圖基礎(chǔ)上,對(duì)文本圖進(jìn)行拆分聚類,得到多個(gè)包含文章不同方面的子圖;對(duì)于每個(gè)節(jié)點(diǎn),利用下式計(jì)算節(jié)點(diǎn)屬于每個(gè)子圖的概率:assigments=softmaxWaHL+ba其中,HL表示GCN最后一層的輸出,Wa、ba是可學(xué)習(xí)參數(shù),a表示計(jì)算注意力權(quán)重的網(wǎng)絡(luò),softmax是歸一化函數(shù);之后,對(duì)節(jié)點(diǎn)表示加權(quán)求和可獲得子圖的表示: 子步驟3-4,構(gòu)建關(guān)鍵詞解碼層;子步驟3-5,構(gòu)建損失函數(shù)層;子步驟3-6,訓(xùn)練所述模型;步驟4:對(duì)待處理的新聞文章生成關(guān)鍵詞對(duì)于需預(yù)測(cè)關(guān)鍵詞的新聞文章,首先用句法依存分析工具分析句法,再構(gòu)建文本句法圖,將新聞文章原文與句法圖輸入到步驟3中訓(xùn)練好的關(guān)鍵詞生成模型中,生成該新聞文章的關(guān)鍵詞。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人東南大學(xué),其通訊地址為:211189 江蘇省南京市玄武區(qū)四牌樓2號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜江西歐菲光學(xué)有限公司鄒海榮獲國家專利權(quán)
- 恭喜寧波麥思動(dòng)力系統(tǒng)有限公司吳聰獲國家專利權(quán)
- 恭喜江西歐菲光學(xué)有限公司鄒海榮獲國家專利權(quán)
- 恭喜英迪股份有限公司林成昶獲國家專利權(quán)
- 恭喜銅陵有色金屬集團(tuán)股份有限公司金冠銅業(yè)分公司趙榮升獲國家專利權(quán)
- 恭喜聯(lián)想(新加坡)私人有限公司約阿希姆·勒爾獲國家專利權(quán)
- 恭喜福特全球技術(shù)公司克勞迪婭·卡塔琳娜·赫盧德科獲國家專利權(quán)
- 恭喜中國恩菲工程技術(shù)有限公司王姣獲國家專利權(quán)
- 恭喜浜松光子學(xué)株式會(huì)社丸野正獲國家專利權(quán)
- 恭喜兆易創(chuàng)新科技集團(tuán)股份有限公司韓飛獲國家專利權(quán)


熱門推薦
- 恭喜華為技術(shù)有限公司劉寧獲國家專利權(quán)
- 恭喜英特爾公司V·馬杜里獲國家專利權(quán)
- 恭喜貝克頓迪金森公司艾琳·夏姆獲國家專利權(quán)
- 恭喜深圳市固勝智能科技有限公司請(qǐng)求不公布姓名獲國家專利權(quán)
- 恭喜巴斯夫歐洲公司J·J·戴利獲國家專利權(quán)
- 恭喜貴州大東風(fēng)機(jī)械有限公司鐘行佳獲國家專利權(quán)
- 恭喜廣州方邦電子股份有限公司蘇陟獲國家專利權(quán)
- 恭喜福特全球技術(shù)公司托馬斯·岑納獲國家專利權(quán)
- 恭喜薩基姆寬帶簡(jiǎn)易股份有限公司弗洛里安·克爾霍斯獲國家專利權(quán)
- 恭喜廣東金萊特電器股份有限公司黃植富獲國家專利權(quán)