恭喜云知聲智能科技股份有限公司王亦寧獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜云知聲智能科技股份有限公司申請的專利一種知識增強的非自回歸神經機器翻譯方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114611488B 。
龍圖騰網通過國家知識產權局官網在2025-04-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210243650.3,技術領域涉及:G06F40/58;該發明授權一種知識增強的非自回歸神經機器翻譯方法及裝置是由王亦寧;劉升平;梁家恩設計研發完成,并于2022-03-12向國家知識產權局提交的專利申請。
本一種知識增強的非自回歸神經機器翻譯方法及裝置在說明書摘要公布了:一種知識增強的非自回歸神經機器翻譯方法及裝置,該方法將雙語平行語言對進行數據預處理和詞向量編碼;將源語言的詞向量表示輸入到編碼器網絡中,所述編碼器網絡將源語言文檔信息進行編碼,得到輸入詞序列信息的編碼表示;使用詞對齊模型構建源語言和目標語言的對應關系,構建繁衍率模型;構建解碼器模型的輸入和輸出編碼表示;通過條件隨機場模型建立目標語言詞匯之間的依賴,依次解碼生成最終的翻譯結果。本發明在解碼端使用條件隨機場進行解碼;預訓練語言模型本身帶有較強的上下文信息,條件隨機場構建了上下文依賴關系,緩解了非自回歸翻譯中較為容易出現的大量重翻、漏翻和前后不一致的現象,有利于得到更高質量的翻譯結果。
本發明授權一種知識增強的非自回歸神經機器翻譯方法及裝置在權利要求書中公布了:1.一種知識增強的非自回歸神經機器翻譯方法,其特征在于,包括以下步驟:1將雙語平行語言對進行數據預處理和詞向量編碼;2將源語言的詞向量表示輸入到編碼器網絡中,所述編碼器網絡將源語言文檔信息進行編碼,得到輸入詞序列信息的編碼表示;3使用詞對齊模型構建源語言和目標語言的對應關系,構建繁衍率模型;4構建解碼器模型的輸入和輸出編碼表示;5通過條件隨機場模型建立目標語言詞匯之間的依賴,依次解碼生成最終的翻譯結果;步驟2包括:21獲取源語言經過詞向量預處理的詞序列矩陣;22使用基于自注意力機制的Transformer層,獲得每個詞經過編碼器網絡的最頂層編碼表示;步驟3包括:31預定義表示不同目標語言的詞序列,使用詞對齊模型構建源語言和目標語言之間的對應關系;32根據源語言和目標語言之間的對應關系,將源語言對應目標語言的token數目作為繁衍率序列;33對步驟22得到的每個詞經過編碼器網絡的最頂層編碼表示計算softmax,得到繁衍率的概率分布;34選擇最大概率對應的輸出作為編碼器網絡的生成結果;步驟33包括:331將輸出的隱狀態進行一層線性變換;332將一層線性變換得到的結果通過softmax輸出繁衍率中的概率分布;步驟4包括:41根據步驟34得到的繁衍率結果構建解碼器端的輸入;42獲得解碼器輸入編碼表示;43獲得解碼器的輸出編碼表示。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人云知聲智能科技股份有限公司,其通訊地址為:100096 北京市海淀區西三旗建材城內1幢一層101號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。