恭喜北京理工大學(xué)史樹(shù)敏獲國(guó)家專(zhuān)利權(quán)
買(mǎi)專(zhuān)利賣(mài)專(zhuān)利找龍圖騰,真高效! 查專(zhuān)利查商標(biāo)用IPTOP,全免費(fèi)!專(zhuān)利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜北京理工大學(xué)申請(qǐng)的專(zhuān)利一種基于高斯核函數(shù)的長(zhǎng)文本檢索方法及系統(tǒng)獲國(guó)家發(fā)明授權(quán)專(zhuān)利權(quán),本發(fā)明授權(quán)專(zhuān)利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN114328863B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-05-06發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專(zhuān)利申請(qǐng)?zhí)?專(zhuān)利號(hào)為:202111512377.1,技術(shù)領(lǐng)域涉及:G06F16/3329;該發(fā)明授權(quán)一種基于高斯核函數(shù)的長(zhǎng)文本檢索方法及系統(tǒng)是由史樹(shù)敏;朱樂(lè);黃河燕設(shè)計(jì)研發(fā)完成,并于2021-12-08向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專(zhuān)利申請(qǐng)。
本一種基于高斯核函數(shù)的長(zhǎng)文本檢索方法及系統(tǒng)在說(shuō)明書(shū)摘要公布了:本發(fā)明涉及一種基于高斯核函數(shù)的長(zhǎng)文本檢索方法及系統(tǒng),屬于信息檢索技術(shù)領(lǐng)域。本方法利用預(yù)訓(xùn)練語(yǔ)言模型的語(yǔ)義建模能力計(jì)算長(zhǎng)文本各段落與用戶檢索內(nèi)容的語(yǔ)義相似度,作為用戶點(diǎn)擊相關(guān)性的偽標(biāo)簽,有效緩解了缺乏段落級(jí)別標(biāo)注數(shù)據(jù)的問(wèn)題。通過(guò)不同的高斯核函數(shù),將偽標(biāo)簽映射為不同維度的相關(guān)性得分。利用線性層聚合長(zhǎng)文本各段落得分來(lái)輸出用戶檢索內(nèi)容對(duì)于長(zhǎng)文本整體的相關(guān)性得分,能夠讓不同語(yǔ)義相似度等級(jí)的段落為用戶點(diǎn)擊相關(guān)與否做出貢獻(xiàn),增強(qiáng)了語(yǔ)義相似度與用戶點(diǎn)擊相關(guān)性的關(guān)聯(lián)程度,提升了長(zhǎng)文本檢索模型的準(zhǔn)確率。
本發(fā)明授權(quán)一種基于高斯核函數(shù)的長(zhǎng)文本檢索方法及系統(tǒng)在權(quán)利要求書(shū)中公布了:1.一種基于高斯核函數(shù)的長(zhǎng)文本檢索系統(tǒng),其特征在于,包括偽標(biāo)簽計(jì)算模塊、高斯核映射模塊和輸出模塊;其中,偽標(biāo)簽計(jì)算模塊負(fù)責(zé)對(duì)長(zhǎng)文檔進(jìn)行分段,并將得到的各個(gè)文本段落與用戶檢索內(nèi)容級(jí)聯(lián)后輸入預(yù)訓(xùn)練語(yǔ)言模型中,得到文本特征交互向量;同時(shí),將文本特征交互向量作為線性層的輸入,將輸出的用戶檢索內(nèi)容與長(zhǎng)文本各段落相關(guān)性作為偽標(biāo)簽;高斯核映射模塊負(fù)責(zé)將偽標(biāo)簽通過(guò)不同高斯核函數(shù),由標(biāo)量映射為得分向量;輸出模塊用于將屬于同一長(zhǎng)文本的不同段落得分向量級(jí)聯(lián)為得分矩陣,將得分矩陣平均池化后放入線性層,判斷并整合用戶檢索內(nèi)容在不同高斯核函數(shù)下與長(zhǎng)文本的相關(guān)性;上述模塊之間的連接關(guān)系為:偽標(biāo)簽計(jì)算模塊的輸出端與高斯核映射模塊的輸入端相連;高斯核映射模塊的輸出端與輸出模塊的輸入端相連;首先,在偽標(biāo)簽計(jì)算模塊中對(duì)長(zhǎng)文本進(jìn)行分段;先對(duì)分段截止點(diǎn)按優(yōu)先度分級(jí),其中,標(biāo)點(diǎn)符號(hào)優(yōu)先級(jí)高于指定最大段落長(zhǎng)度,然后,將分段所得段落分別與用戶檢索內(nèi)容級(jí)聯(lián),并輸入至預(yù)訓(xùn)練語(yǔ)言模型中,得到文本特征交互向量,最后,將所述文本特征交互向量放入線性層中,輸出用戶檢索內(nèi)容與長(zhǎng)文本各段落的相關(guān)性,作為偽標(biāo)簽;在偽標(biāo)簽計(jì)算模塊中,預(yù)訓(xùn)練語(yǔ)言模型得到文本特征交互向量Vi,如式1所示:Vi=BERTq,pj1其中,i的取值范圍為1、2、3、…、n,n指長(zhǎng)文本可劃分段落數(shù)目的最大值;q為用戶檢索內(nèi)容,pj為長(zhǎng)文本的第j個(gè)段落;所述線性層指全連接神經(jīng)網(wǎng)絡(luò),將文本特征交互向量映射為相關(guān)性,如式2所示:R=W*Vi+b2其中,R表示模型輸出的相關(guān)性得分,W、b為模型參數(shù),能夠在模型訓(xùn)練過(guò)程中通過(guò)反向傳播求解;Vi代表第i個(gè)段落與用戶檢索內(nèi)容的文本特征交互向量;在高斯核映射模塊中,首先初始化不同高斯核的均值和方差,其中,各個(gè)高斯核均值不同但方差系統(tǒng);然后,將偽標(biāo)簽計(jì)算模塊輸出的偽標(biāo)簽放入不同高斯核進(jìn)行映射,將所得結(jié)果級(jí)聯(lián)在一起,構(gòu)成得分向量;所述高斯核函數(shù)映射如式3所示:KRi=exp-Ri-μk2σk23其中,KRi表示,Ri為用戶檢索內(nèi)容q與第i個(gè)段落的偽標(biāo)簽,μk、σk分別表示第k個(gè)高斯核的均值和方差,exp為指數(shù)函數(shù);在輸出模塊中,首先將長(zhǎng)文本不同段落對(duì)應(yīng)得分向量級(jí)聯(lián)在一起,得到得分矩陣;將得分矩陣平均池化后,輸入至線性層,輸出最終的用戶檢索內(nèi)容與長(zhǎng)文本相關(guān)性打分;最后,利用MLP判斷在不同等級(jí)下長(zhǎng)文本各段落對(duì)于最終用戶點(diǎn)擊相關(guān)性的貢獻(xiàn)。
如需購(gòu)買(mǎi)、轉(zhuǎn)讓、實(shí)施、許可或投資類(lèi)似專(zhuān)利技術(shù),可聯(lián)系本專(zhuān)利的申請(qǐng)人或?qū)@麢?quán)人北京理工大學(xué),其通訊地址為:100081 北京市海淀區(qū)中關(guān)村南大街5號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜原啟生物科技(上海)有限責(zé)任公司凌有國(guó)獲國(guó)家專(zhuān)利權(quán)
- 恭喜首爾半導(dǎo)體株式會(huì)社樸哉垠獲國(guó)家專(zhuān)利權(quán)
- 恭喜上海海立電器有限公司樂(lè)紅勝獲國(guó)家專(zhuān)利權(quán)
- 恭喜常州智谷機(jī)電科技有限公司陳中華獲國(guó)家專(zhuān)利權(quán)
- 恭喜休思樂(lè)公司J·格利克斯坦獲國(guó)家專(zhuān)利權(quán)
- 恭喜元平臺(tái)技術(shù)有限公司陳松獲國(guó)家專(zhuān)利權(quán)
- 恭喜伊頓智能動(dòng)力有限公司T·M·克洛姆里獲國(guó)家專(zhuān)利權(quán)
- 恭喜上海競(jìng)捷醫(yī)療科技有限公司岳斌獲國(guó)家專(zhuān)利權(quán)
- 恭喜安培簡(jiǎn)式股份有限公司A·西莫寧獲國(guó)家專(zhuān)利權(quán)
- 恭喜AGC株式會(huì)社德永博文獲國(guó)家專(zhuān)利權(quán)


熱門(mén)推薦
- 恭喜曺永華獲國(guó)家專(zhuān)利權(quán)
- 恭喜耐克創(chuàng)新有限合伙公司杰伊·康斯坦丁諾獲國(guó)家專(zhuān)利權(quán)
- 恭喜捷銳士股份有限公司J·T·潘森貝克獲國(guó)家專(zhuān)利權(quán)
- 恭喜中煤天津設(shè)計(jì)工程有限責(zé)任公司郭大林獲國(guó)家專(zhuān)利權(quán)
- 恭喜羅伯特·博世有限公司A·賽義德獲國(guó)家專(zhuān)利權(quán)
- 恭喜江蘇德瑞加數(shù)控機(jī)床有限公司張宗鵬獲國(guó)家專(zhuān)利權(quán)
- 恭喜蘇州晶湛半導(dǎo)體有限公司程凱獲國(guó)家專(zhuān)利權(quán)
- 恭喜劉太欣獲國(guó)家專(zhuān)利權(quán)
- 恭喜西門(mén)子股份公司賈納尼·韋努戈帕蘭獲國(guó)家專(zhuān)利權(quán)
- 恭喜深圳供電局有限公司張繁獲國(guó)家專(zhuān)利權(quán)