恭喜上海稀宇極智科技有限公司金瑞洋獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜上海稀宇極智科技有限公司申請的專利語音合成方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119400155B 。
龍圖騰網通過國家知識產權局官網在2025-05-13發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411879546.9,技術領域涉及:G10L13/10;該發明授權語音合成方法及裝置是由金瑞洋;楊明祺;李亞偉設計研發完成,并于2023-12-29向國家知識產權局提交的專利申請。
本語音合成方法及裝置在說明書摘要公布了:本申請是202311870114.7的分案申請,公開語音合成方法,包括將目標文本按照文本順序分成多個目標文本段;將多個目標文本段中的最后目標文本段輸入到語音合成模型中,獲得最后目標音頻段;根據最后目標文本段和最后目標音頻段拼接得到文本?音頻交替序列;獲取前一目標文本段,將前一目標文本段添加到文本?音頻交替序列;將文本?音頻交替序列輸入到語音合成模型以獲取前一目標文本段的前一目標音頻段,將前一目標音頻段添加到文本?音頻交替序列尾部,直至獲取首個目標文本段對應的首個目標音頻段;將各個目標音頻段進行拼接處理,生成目標音頻。本申請能夠利用文本、音頻的上下文進行文字理解,捕捉場景中的韻律、音律和情感。
本發明授權語音合成方法及裝置在權利要求書中公布了:1.一種語音合成方法,其特征在于,包括如下步驟:獲取目標文本,將所述目標文本按照文本順序分成多個目標文本段;將所述多個目標文本段中的最后目標文本段輸入到訓練好的語音合成模型中,獲得最后目標音頻段;根據所述最后目標文本段和所述最后目標音頻段拼接得到文本-音頻交替序列;循環執行如下步驟直至獲取首個目標文本段對應的首個目標音頻段:獲取前一目標文本段,將所述前一目標文本段添加到所述文本-音頻交替序列以對所述文本-音頻交替序列進行更新;將文本-音頻交替序列輸入到所述訓練好的語音合成模型以獲取對應所述前一目標文本段的前一目標音頻段,將所述前一目標音頻段添加到所述文本-音頻交替序列尾部以對所述文本-音頻交替序列進行更新;將各個目標音頻段進行拼接處理,生成目標音頻;其中,所述語音合成模型的訓練過程包括如下步驟:獲取初始訓練數據,其中,所述初始訓練數據包括連貫文本和對應的連貫音頻;從所述連貫文本中選取多個第一文本段、多個位于第一文本段前與所述第一文本段相鄰的第二文本段、多個位于第一文本段后與所述第一文本段相鄰的第三文本段,并從所述連貫音頻中獲取與所述多個第一文本段、第二文本段和第三文本段分別對應的多個第一音頻段、第二音頻段、第三音頻段;檢測關聯的第一文本段、第二文本段、第三文本段、第一音頻段、第二音頻段和第三音頻段是否滿足可拼接條件;將滿足可拼接條件的第一文本段、第二文本段、第三文本段、第一音頻段、第二音頻段和第三音頻段,按照文本順序,以文本和音頻交替的方式拼接得到組合訓練數據,以生成包括多個所述組合訓練數據的組合訓練數據集;根據所述組合訓練數據集,對初始語音合成模型進行訓練,得到訓練好的語音合成模型,在所述訓練中所述第二文本段和或所述第三文本段中的韻律、音律和或情感特征被提取出來并被用于語音合成模型的訓練。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人上海稀宇極智科技有限公司,其通訊地址為:200233 上海市徐匯區虹漕路25-1號2層896室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。