恭喜騰訊科技(深圳)有限公司梁云龍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜騰訊科技(深圳)有限公司申請的專利一種文本處理方法、系統及存儲介質和終端設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114328805B 。
龍圖騰網通過國家知識產權局官網在2025-05-30發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202110902041.X,技術領域涉及:G06F16/334;該發明授權一種文本處理方法、系統及存儲介質和終端設備是由梁云龍;孟凡東;徐金安;陳鈺楓設計研發完成,并于2021-08-06向國家知識產權局提交的專利申請。
本一種文本處理方法、系統及存儲介質和終端設備在說明書摘要公布了:本發明實施例公開了一種文本處理方法、系統及存儲介質和終端設備,應用于基于人工智能的信息處理技術領域。在預訓練跨語言摘要模型的過程中確定的初始訓練模型中包括了三個支路的編碼后處理模塊,分別對應三個不同的任務,即確定翻譯信息、單語言摘要信息和跨語言摘要信息,而這三個任務共享了同一特征編碼模塊和同一特征提取模塊,由于確定跨語言摘要信息這個任務可以是確定翻譯信息和單語言摘要信息這兩個子任務的整合,在訓練跨語言摘要模型的過程中利用了實現這三個任務的信息,同時考慮到了確定跨語言摘要信息這個整體任務及其包括的子任務,使得訓練得到的跨語言摘要模型在提取跨語言摘要信息時更準確。
本發明授權一種文本處理方法、系統及存儲介質和終端設備在權利要求書中公布了:1.一種文本處理方法,其特征在于,包括:獲取目標對象,調用預訓練的跨語言摘要模型;通過所述跨語言摘要模型提取所述目標對象的跨語言摘要信息;其中,通過如下步驟預訓練所述跨語言摘要模型:確定初始訓練模型,所述初始訓練模型包括特征提取模塊、特征編碼模塊和三個支路的編碼后處理模塊,所述特征提取模塊用于提取樣本對象的特征信息,特征編碼模塊用于對樣本對象的特征信息進行編碼得到編碼后特征,所述三個支路中第一支路的編碼后處理模塊用于根據所述編碼后特征確定所述樣本對象的翻譯信息,所述三個支路中第二支路的編碼后處理模塊用于根據所述編碼后特征確定所述樣本對象的單語言摘要信息,所述三個支路中第三支路的編碼后處理模塊用于根據所述編碼后特征確定樣本對象的跨語言摘要信息;確定訓練樣本,所述訓練樣本中包括多個第一樣本對象及其翻譯標注、多個第二樣本對象及其單語言摘要標注和多個第三樣本對象及其跨語言摘要標注;根據所述初始訓練模型和訓練樣本訓練所述跨語言摘要模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518057 廣東省深圳市南山區高新區科技中一路騰訊大廈35層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。