恭喜內蒙古工業大學仁慶道爾吉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜內蒙古工業大學申請的專利基于ghost和iLPCnet的蒙古語語音合成方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114822487B 。
龍圖騰網通過國家知識產權局官網在2025-04-01發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210252979.6,技術領域涉及:G10L13/02;該發明授權基于ghost和iLPCnet的蒙古語語音合成方法是由仁慶道爾吉;張文靜;薩和雅;代欽;錫林格日勒設計研發完成,并于2022-03-15向國家知識產權局提交的專利申請。
本基于ghost和iLPCnet的蒙古語語音合成方法在說明書摘要公布了:本發明公開一種基于ghost和iLPCnet的蒙古語語音合成方法,基于Bang預訓練模型,對齊蒙古語音素信息序列;基于ghost的聲學模型,根據音素序列生成聲學特征;以iLPCnet模型為聲碼器,進行聲學特征到語音波形的轉換。本發明使用Encoder?Decoder模型將蒙古語文本轉化成音素,其次使用基于ghost的聲學模型將音素直接生成mel頻譜,iLPCnet聲碼器直接將mel頻譜轉化為語音波形,可以無縫地集成到端到端的TTS系統降低了對參數的需求,提高了語音合成的速度,適合于小語種的語音合成。
本發明授權基于ghost和iLPCnet的蒙古語語音合成方法在權利要求書中公布了:1.一種基于ghost和iLPCnet的蒙古語語音合成方法,其特征在于,包括如下步驟:步驟1,提取蒙古文的文本特征,并將文本特征編碼轉換為音素序列,所述音素序列輸入至Bang預訓練模型;所述Bang預訓練模型由多層堆疊的Transformer編碼器和多層堆疊的Transformer解碼器組成;所述Transformer編碼器使用自注意力機制,所述Transformer解碼器使用跨流可見多流自注意力機制;所述跨流可見多流自注意力機制,在第一個預測流中,每個輸入的蒙古語音素信息均是有依賴關系的,每個音素均以自回歸進行預測;在剩余預測流中,第一個音素以非自回歸進行預測,其他音素則以介于自回歸和非自回歸之間的方式進行預測;目標序列長度|Y|=n,則Bang預訓練模型設置n個預測流,此時每個音素的前i個信息被掩碼替換的情形,均能夠在同一個時間步中被并行預測;步驟2,利用Bang預訓練模型訓練蒙古文音素信息,將音素信息對齊;步驟3,基于加輕量級ghost模塊的deepvoice3聲學模型,通過音素信息生成聲學特征;步驟4,以融入蒙古語語音特征的iLPCnet模型為聲碼器,將聲學特征轉換為語音波形,進而實現蒙古語語音合成。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人內蒙古工業大學,其通訊地址為:010080 內蒙古自治區呼和浩特市土默特左旗內蒙古工業大學金川校區;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。