恭喜北京中科匯理科技有限公司石戈獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京中科匯理科技有限公司申請的專利一種基于顯著性歸因的科學論文摘要語步識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117540731B 。
龍圖騰網通過國家知識產權局官網在2025-04-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311322278.6,技術領域涉及:G06F40/279;該發明授權一種基于顯著性歸因的科學論文摘要語步識別方法及系統是由石戈;馮沖設計研發完成,并于2023-10-12向國家知識產權局提交的專利申請。
本一種基于顯著性歸因的科學論文摘要語步識別方法及系統在說明書摘要公布了:本申請公開了一種基于顯著性歸因的科學論文摘要語步識別方法及系統,其中方法包括:提取待識別科學論文摘要中每個句子的上下文信息和對應的位置特征信息;編碼所述待識別科學論文摘要每個句子的所述上下文信息和所述位置特征信息,并將編碼后的所述上下文信息的特征向量與對應位置特征信息的編碼向量進行拼接得到對應句子的識別數據;將所述待識別科學論文摘要每個句子的所述識別數據輸入基于顯著性歸因訓練得到的語步識別模型,預測得到所述待識別科學論文摘要每個句子的語步標簽。通過本申請可以充分的挖掘待識別句子前后語句對待識別句子的標簽預測影響,提高語步標簽識別準確性。
本發明授權一種基于顯著性歸因的科學論文摘要語步識別方法及系統在權利要求書中公布了:1.一種基于顯著性歸因的科學論文摘要語步識別方法,其特征在于,包括以下步驟:提取待識別科學論文摘要中每個句子的上下文信息和對應的位置特征信息;編碼所述待識別科學論文摘要每個句子的所述上下文信息和所述位置特征信息,并將編碼后的所述上下文信息的特征向量與對應位置特征信息的編碼向量進行拼接得到對應句子的識別數據;將所述待識別科學論文摘要每個句子的所述識別數據輸入基于顯著性歸因訓練得到的語步識別模型,預測得到所述待識別科學論文摘要每個句子的語步標簽;其中,所述基于顯著性歸因訓練得到的語步識別模型的訓練過程包括:利用訓練數據集進行第一次訓練;基于顯著性歸因和所述第一次訓練預測得到的語步標簽,對所述訓練數據集中訓練數據對應的識別數據進行修正,利用訓練數據修正后的識別數據進行第二次訓練,得到語步識別模型;所述基于顯著性歸因訓練得到的語步識別模型的訓練過程包括:收集大量科學論文摘要,并對每篇科學論文摘要進行語步標簽的標注,得到訓練語料集;提取所述訓練語料集中每篇科學論文摘要中每個句子的上下文信息和該句子的位置特征信息,并將句子、對應的上下文信息和位置特征信息關聯存儲在訓練數據集中,其中,所述訓練數據集的每個訓練數據包括標注了標簽的句子以及該句子對應上下文信息和位置特征信息;將所述訓練數據集的訓練數據輸入預訓練模型,對當前待識別的句子的所述上下文信息進行編碼,并將編碼后上下文信息的特征向量與對應位置特征信息的編碼向量進行拼接得到當前待識別的句子的識別數據;將所述訓練數據集所有訓練數據的所述識別數據全部輸入多層感知器,預測所述識別數據對應的當前待識別的句子的語步標簽,完成第一次訓練;根據所述訓練數據集預測得到的語步標簽計算訓練數據集每個句子中每個詞對預測的顯著性值;通過句子每個詞對預測的所述顯著性值對句子的上下文信息的特征向量進行修正,并將修正后的上下文信息的特征向量與對應的位置特征信息的編碼向量進行拼接得到句子的新的識別數據;將所述訓練數據集所有訓練數據新的識別數據輸入經過第一次訓練的多層感知器,完成第二次訓練,訓練得到語步識別模型;根據所述訓練數據集預測得到的語步標簽計算訓練數據集每個句子中每個詞對預測的顯著性值包括:對句子進行分詞處理,得到組成句子的多個詞;利用集成梯度方法計算句子的每個詞對預測的顯著性值;其中,使用損失函數L作為期望的模型并相應地進行評估,句子的詞wi對預測的顯著性值的計算公式如下: 其中,S=[w1,w2,…,wN]為包括N個詞的句子;Gs為句子S的句子級事件標簽;i表示句子S的第i個詞;xi是句子的詞wi在BERT模型中的向量表示,XS是句子S在BERT中的輸入嵌入;X'是全零向量序列,x'i表示X'中的第i個元素;α為定積分的自變量,取值從0到1; 其中,N為句子S的詞的總數;n為數列求和公式下標;||||表示正則化函數L2范數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京中科匯理科技有限公司,其通訊地址為:102218 北京市昌平區東小口鎮天通中苑二區21號樓9層907;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。