国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預(yù)訂訂單
服務(wù)訂單
發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標 發(fā)布需求

在線咨詢

聯(lián)系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務(wù) 國際服務(wù) 商標交易 會員權(quán)益 IP管家助手 需求市場 關(guān)于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜平安科技(深圳)有限公司張旭龍獲國家專利權(quán)

恭喜平安科技(深圳)有限公司張旭龍獲國家專利權(quán)

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!

龍圖騰網(wǎng)恭喜平安科技(深圳)有限公司申請的專利一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN113889072B

龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-05-16發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202111138448.6,技術(shù)領(lǐng)域涉及:G10L13/027;該發(fā)明授權(quán)一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)是由張旭龍;王健宗設(shè)計研發(fā)完成,并于2021-09-27向國家知識產(chǎn)權(quán)局提交的專利申請。

一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)在說明書摘要公布了:本申請涉及人工智能技術(shù),提供一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)。方法包括:獲取訓(xùn)練樣本,訓(xùn)練樣本包括第一訓(xùn)練文本信息以及訓(xùn)練語音信息;通過GST模型對第一訓(xùn)練文本信息進行情感識別處理,得到情感向量,并將情感向量嵌入TTS模型;通過TTS模型對第一訓(xùn)練文本信息和情感向量進行語音合成處理,得到預(yù)測語音信息;將預(yù)測語音信息和訓(xùn)練語音信息進行比較,得到語音合成損失值;基于語音合成損失值對語音合成模型中的TTS模型的參數(shù)和GST模型的參數(shù)進行調(diào)整,以對語音合成模型進行訓(xùn)練,得到訓(xùn)練后的語音合成模型,可實現(xiàn)在不對訓(xùn)練樣本進行情感標注的前提下,仍然可以使用TTS模型將文字轉(zhuǎn)為情感化語音,提高語音合成模型的訓(xùn)練效率。

本發(fā)明授權(quán)一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)在權(quán)利要求書中公布了:1.一種語音合成模型的訓(xùn)練方法,其特征在于,包括:獲取訓(xùn)練樣本,所述訓(xùn)練樣本包括第一訓(xùn)練文本信息以及所述第一訓(xùn)練文本信息對應(yīng)的訓(xùn)練語音信息;通過語音合成模型中的全局風(fēng)格標簽GST模型對所述第一訓(xùn)練文本信息進行情感識別處理,得到所述第一訓(xùn)練文本信息的情感向量,并將所述第一訓(xùn)練文本信息的情感向量嵌入所述語音合成模型中的文本語音轉(zhuǎn)換TTS模型;所述情感識別處理包括:通過所述GST模型中的參考編碼器對所述第一訓(xùn)練文本信息進行編碼,得到參考向量;使用注意機制計算所述參考向量和初始化向量之間的相似度,得到一組權(quán)重值;將所述一組權(quán)重值與所述初始化向量進行加權(quán)運算,得到所述第一訓(xùn)練文本信息的情感向量;通過所述TTS模型對所述第一訓(xùn)練文本信息進行語言學(xué)習(xí),得到所述第一訓(xùn)練文本信息的底層結(jié)構(gòu)特征;通過所述TTS模型對所述第一訓(xùn)練文本信息的底層結(jié)構(gòu)特征和所述第一訓(xùn)練文本信息的情感向量進行對齊處理,得到所述第一訓(xùn)練文本信息對應(yīng)的預(yù)測語音信息;所述TTS模型包括注意力機制模塊,所述注意力機制模塊包括壓縮和激勵網(wǎng)絡(luò)SENet或者基于卷積塊的注意機制CBAM,且所述注意力機制模塊基于當前任務(wù)需求確定;所述SENet基于各特征通道的重要程度增強對當前任務(wù)有用的特征并抑制對當前任務(wù)用處不大的特征,所述CBAM包含通道注意力模塊CAM和空間注意力模塊SAM,以用于分別進行通道與空間上的注意機制;將所述第一訓(xùn)練文本信息對應(yīng)的預(yù)測語音信息和所述訓(xùn)練語音信息進行比較,得到語音合成損失值;基于所述語音合成損失值對所述TTS模型的參數(shù)和GST模型的參數(shù)進行調(diào)整,以對所述語音合成模型進行訓(xùn)練,得到訓(xùn)練后的語音合成模型,所述訓(xùn)練后的語音合成模型包括訓(xùn)練后的GST模型和訓(xùn)練后的TTS模型;在第二電子設(shè)備運行有即時通訊客戶端,且在用戶駕車或者處于顛簸環(huán)境場景中,若所述即時通訊客戶端中的會話界面包括至少一個文本信息,則響應(yīng)于針對所述文本信息的語音轉(zhuǎn)換指令,獲取所述語音轉(zhuǎn)換指令對應(yīng)的目標文本信息,以利用所述訓(xùn)練后的語音合成模型確定目標文本信息對應(yīng)的預(yù)測語音信息,并播放所述預(yù)測語音信息;在智能診療或者遠程會診過程中,若檢測到病人無法挪動身體,且第二電子設(shè)備與病人之間達到預(yù)設(shè)距離,則將對端用戶輸入的文本信息作為目標文本信息,以利用訓(xùn)練后的語音合成模型確定目標文本信息對應(yīng)的預(yù)測語音信息,并播放所述預(yù)測語音信息。

如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人平安科技(深圳)有限公司,其通訊地址為:518000 廣東省深圳市福田區(qū)福田街道福安社區(qū)益田路5033號平安金融中心23樓;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

免責聲明
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。
主站蜘蛛池模板: 巧家县| 盐源县| 湘阴县| 古浪县| 乌鲁木齐市| 准格尔旗| 桂林市| 怀柔区| 九江市| 曲松县| 大厂| 盱眙县| 新密市| 新安县| 沈丘县| 微山县| 马山县| 阜阳市| 扬中市| 襄汾县| 盐源县| 新化县| 乐陵市| 长乐市| 鄂托克旗| 临潭县| 遵义市| 全州县| 辉南县| 化隆| 平利县| 忻城县| 阳谷县| 邯郸市| 凤庆县| 沾化县| 镇沅| 西平县| 张家口市| 扶风县| 龙南县|