恭喜華東師范大學(xué)李祥學(xué)獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜華東師范大學(xué)申請(qǐng)的專利一種可擴(kuò)展的通用端到端命名實(shí)體識(shí)別方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN115130475B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-04-01發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202210617397.3,技術(shù)領(lǐng)域涉及:G06F40/295;該發(fā)明授權(quán)一種可擴(kuò)展的通用端到端命名實(shí)體識(shí)別方法是由李祥學(xué);李軒舟設(shè)計(jì)研發(fā)完成,并于2022-06-01向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種可擴(kuò)展的通用端到端命名實(shí)體識(shí)別方法在說明書摘要公布了:本發(fā)明公開了一種可擴(kuò)展的通用端到端命名實(shí)體識(shí)別方法,包括文本預(yù)處理過程,構(gòu)建模型M,訓(xùn)練模型M,使用模型M進(jìn)行預(yù)測(cè)和實(shí)體解析過程,模型M包括輸入層、上下文編碼層、圖建模層。文本預(yù)處理過程:接收一個(gè)文本輸入和一個(gè)實(shí)體類別,生成輸入序列;訓(xùn)練模型包括獲取數(shù)據(jù)集,將數(shù)據(jù)集轉(zhuǎn)換為訓(xùn)練集,使用訓(xùn)練集對(duì)模型進(jìn)行多輪訓(xùn)練;模型訓(xùn)練結(jié)束后,將文本預(yù)處理過程處理過的輸入序列輸入模型M,模型M的圖建模層計(jì)算詞之間的連接關(guān)系,最后解析圖中識(shí)別到的實(shí)體。本發(fā)明可以適應(yīng)實(shí)體重疊和實(shí)體非連續(xù)情況下的識(shí)別,而且能夠適應(yīng)需求變動(dòng)如新增實(shí)體類別的情況而無需修改模型結(jié)構(gòu),因此容易進(jìn)行擴(kuò)展和領(lǐng)域遷移學(xué)習(xí)。
本發(fā)明授權(quán)一種可擴(kuò)展的通用端到端命名實(shí)體識(shí)別方法在權(quán)利要求書中公布了:1.一種可擴(kuò)展的通用端到端命名實(shí)體識(shí)別方法,其特征在于,該方法包括以下具體步驟:步驟1:文本預(yù)處理過程,生成輸入序列,具體為:接收一個(gè)文本輸入和一個(gè)實(shí)體類別,在文本首尾各加上一個(gè)符號(hào),將實(shí)體類別添加在文本的尾部;對(duì)首尾添加了符號(hào)和實(shí)體類別的輸入文本進(jìn)行分詞,獲得詞序列;將詞序列映射為數(shù)字,數(shù)字和詞一一映射,滿足雙射關(guān)系,以映射后的數(shù)字序列為輸入序列,輸出為該序列;步驟2:構(gòu)建模型M,包括:使用上下文編碼層接收文本預(yù)處理過程輸出的輸入序列,利用自注意力機(jī)制,生成詞向量組,丟棄實(shí)體類別名稱對(duì)應(yīng)的詞向量;用有向連接圖來建模詞之間的有向連接關(guān)系,使用詞向量組計(jì)算各個(gè)詞之間的有向連接圖,有向連接圖使用矩陣表示,輸出為矩陣表示的圖;步驟3:訓(xùn)練模型M;步驟4:使用模型M進(jìn)行預(yù)測(cè);步驟5:對(duì)步驟4模型的輸出進(jìn)行實(shí)體解析,具體為:接收模型M輸出的圖,從頭開始,遍歷整張圖,除了首符號(hào)直接連接到最后尾符號(hào)的路徑,每一條以首符號(hào)為開始,以最后的尾符號(hào)為結(jié)束的路徑對(duì)應(yīng)的詞按路徑順序組合都是一個(gè)屬于該類別的實(shí)體,輸出為解析出的實(shí)體集合;其中:步驟2所述用有向連接圖來建模詞之間的有向連接關(guān)系,使用詞向量組計(jì)算各個(gè)詞之間的有向連接圖,具體為:如果一個(gè)詞為實(shí)體的開始,則建立一條句首符號(hào)連接到該詞有向邊;如果在一個(gè)實(shí)體中,一個(gè)詞B緊跟在詞A之后,則建立一條由詞A連接到詞B的有向邊;如果一個(gè)詞為實(shí)體的結(jié)束,則建立一條該詞連接到尾符號(hào)的有向邊;將除了首尾符號(hào)以外的詞稱為中間詞,對(duì)應(yīng)的詞向量為中間詞向量;利用第一個(gè)詞向量和中間詞向量計(jì)算首符號(hào)和中間詞的連接關(guān)系,表示該中間詞開始實(shí)體的概率;利用任意兩個(gè)中間詞的詞向量計(jì)算兩個(gè)詞之間的連接關(guān)系;使用尾詞向量和中間詞的詞向量計(jì)算中間詞和句尾符號(hào)之間的連接關(guān)系,表示以該中間詞結(jié)束一個(gè)實(shí)體的概率;計(jì)算完成后,得到詞之間用矩陣表示的有向連接圖;所述訓(xùn)練模型M,具體為:獲取標(biāo)注好的數(shù)據(jù)集,數(shù)據(jù)集中的每一條數(shù)據(jù)包括文本t和標(biāo)簽y,標(biāo)簽y中記錄了該文本包含的所有實(shí)體類別以及對(duì)應(yīng)的實(shí)體集合,如果文本t不包含任何類型的實(shí)體,則標(biāo)簽y為空;將數(shù)據(jù)集轉(zhuǎn)換為訓(xùn)練集:定義數(shù)據(jù)集中出現(xiàn)的所有實(shí)體類別名稱為集合S,設(shè)集合S包含n種實(shí)體類別名稱;對(duì)于數(shù)據(jù)集中的每一條數(shù)據(jù)t,y,t為文本,y為標(biāo)簽,對(duì)于集合S中每一個(gè)類別s,如果標(biāo)簽y中包含對(duì)應(yīng)類別s的實(shí)體,即該文本t包含屬于類別s的實(shí)體非空集合e,以類別s以及對(duì)應(yīng)的實(shí)體集合e作為標(biāo)簽y′,將文本t和標(biāo)簽y′作為訓(xùn)練集中的一條數(shù)據(jù);如果該文本t不包含屬于類別s的實(shí)體,以類別s以及對(duì)應(yīng)的實(shí)體空集e′作為標(biāo)簽y′,將文本t和標(biāo)簽y′作為訓(xùn)練集中的一條數(shù)據(jù);使用訓(xùn)練集對(duì)模型M進(jìn)行多輪訓(xùn)練,每一輪訓(xùn)練包括:將訓(xùn)練集的數(shù)據(jù)分為多批,每次從訓(xùn)練集中抽取一批數(shù)據(jù),對(duì)于取出的每一條數(shù)據(jù),利用標(biāo)簽中的實(shí)體集合生成該批數(shù)據(jù)的鄰接矩陣的真實(shí)值;對(duì)于一批數(shù)據(jù)中的每一條,使用步驟1文本預(yù)處理過程處理該條數(shù)據(jù)中的文本和標(biāo)簽中的實(shí)體類別,生成輸入序列;將該輸入序列輸入模型,模型計(jì)算包括符號(hào)在內(nèi)的所有詞之間的連接關(guān)系,輸出一個(gè)鄰接矩陣;最后利用模型預(yù)測(cè)的矩陣和標(biāo)簽生成的真實(shí)值矩陣計(jì)算損失并根據(jù)損失更新模型的權(quán)重;所述使用模型M進(jìn)行預(yù)測(cè),具體為:輸入一條文本以在其中提取實(shí)體,不包含標(biāo)簽及其他信息;選擇一個(gè)實(shí)體類別以確定要在該文本中搜索的實(shí)體類別;將文本和實(shí)體類別輸入步驟1文本預(yù)處理過程,得到輸入序列;將輸入序列輸入模型M,模型輸出一個(gè)鄰接矩陣表示的圖。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人華東師范大學(xué),其通訊地址為:200241 上海市閔行區(qū)東川路500號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜中車戚墅堰機(jī)車車輛工藝研究所股份有限公司張?jiān)倮@國家專利權(quán)
- 恭喜三星電子株式會(huì)社裴成桓獲國家專利權(quán)
- 恭喜佛山市順德區(qū)華酷電器科技有限公司宋雨果獲國家專利權(quán)
- 恭喜山東奔速電梯股份有限公司李長明獲國家專利權(quán)
- 恭喜生命技術(shù)公司S.尚卡爾獲國家專利權(quán)
- 恭喜伊愛慕威訊醫(yī)療設(shè)備有限公司阿明·阿波什獲國家專利權(quán)
- 恭喜英飛凌科技奧地利有限公司張超發(fā)獲國家專利權(quán)
- 恭喜甘肅華予高原生態(tài)牧業(yè)有限公司胡耀清獲國家專利權(quán)
- 恭喜珠海格力電器股份有限公司徐余良獲國家專利權(quán)
- 恭喜騰訊云計(jì)算(北京)有限責(zé)任公司胡啟宇獲國家專利權(quán)


熱門推薦
- 恭喜新疆大學(xué)周建平獲國家專利權(quán)
- 恭喜三星顯示有限公司羅志洙獲國家專利權(quán)
- 恭喜青海省藥品檢驗(yàn)檢測(cè)院王珺獲國家專利權(quán)
- 恭喜杰華特微電子股份有限公司孫明波獲國家專利權(quán)
- 恭喜北京石頭世紀(jì)科技股份有限公司劉曉明獲國家專利權(quán)
- 恭喜桑尼泰克精密工業(yè)股份有限公司顧中權(quán)獲國家專利權(quán)
- 恭喜小衛(wèi)(上海)生物科技有限公司劉尊峰獲國家專利權(quán)
- 恭喜中國地質(zhì)大學(xué)(武漢)顏誠獲國家專利權(quán)
- 恭喜科磊股份有限公司D·米克爾松獲國家專利權(quán)
- 恭喜波士頓科學(xué)醫(yī)學(xué)有限公司邁克爾·S·H·初獲國家專利權(quán)