中南大學(xué)姚鑫獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉中南大學(xué)申請(qǐng)的專利一種語音對(duì)抗樣本生成方法、裝置、終端設(shè)備及介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN117037843B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-04-15發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202311165130.6,技術(shù)領(lǐng)域涉及:G10L25/30;該發(fā)明授權(quán)一種語音對(duì)抗樣本生成方法、裝置、終端設(shè)備及介質(zhì)是由姚鑫;王晨陽;趙明;唐楓梟;安森泉設(shè)計(jì)研發(fā)完成,并于2023-09-11向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種語音對(duì)抗樣本生成方法、裝置、終端設(shè)備及介質(zhì)在說明書摘要公布了:本申請(qǐng)適用于語音安全技術(shù)領(lǐng)域,提供了一種語音對(duì)抗樣本生成方法、裝置、終端設(shè)備及介質(zhì)。該方法通過獲取待擾動(dòng)語音樣本集;計(jì)算其他說話人與當(dāng)前說話人之間的語音相似度,確定目標(biāo)說話人;對(duì)待擾動(dòng)語音樣本集進(jìn)行語音端點(diǎn)檢測,得到候選擾動(dòng)語音幀;計(jì)算優(yōu)先度和優(yōu)先頻數(shù),確定優(yōu)先重合幀;根據(jù)優(yōu)先重合幀,確定待擾動(dòng)語音樣本集中的擾動(dòng)點(diǎn)和擾動(dòng)值,對(duì)待擾動(dòng)語音樣本集進(jìn)行擾動(dòng),得到擾動(dòng)結(jié)果;計(jì)算擾動(dòng)結(jié)果與目標(biāo)說話人對(duì)應(yīng)的語音樣本集之間的損失值;利用投影梯度下降算法對(duì)擾動(dòng)點(diǎn)和擾動(dòng)值進(jìn)行更新,將損失值小于預(yù)設(shè)損失閾值的擾動(dòng)結(jié)果作為當(dāng)前說話人對(duì)應(yīng)的語音對(duì)抗樣本。本申請(qǐng)能夠提高身份去識(shí)別效果和語音合成質(zhì)量。
本發(fā)明授權(quán)一種語音對(duì)抗樣本生成方法、裝置、終端設(shè)備及介質(zhì)在權(quán)利要求書中公布了:1.一種語音對(duì)抗樣本生成方法,其特征在于,包括:步驟1,獲取當(dāng)前說話人對(duì)應(yīng)的待擾動(dòng)語音樣本集,以及多個(gè)其他說話人對(duì)應(yīng)的語音樣本集;步驟2,分別計(jì)算每個(gè)所述其他說話人與所述當(dāng)前說話人之間的語音相似度,并從所述語音相似度小于預(yù)設(shè)相似度閾值的其他說話人中,確定出目標(biāo)說話人;步驟3,對(duì)所述待擾動(dòng)語音樣本集進(jìn)行語音端點(diǎn)檢測,得到所述待擾動(dòng)語音樣本集中的多個(gè)候選擾動(dòng)語音幀;所述候選擾動(dòng)語音幀用于確定被擾動(dòng)的語音幀;步驟4,利用多個(gè)不同的說話人識(shí)別模型分別計(jì)算每個(gè)所述候選擾動(dòng)語音幀對(duì)應(yīng)的優(yōu)先度和優(yōu)先頻數(shù),并根據(jù)所述優(yōu)先頻數(shù)和所述優(yōu)先度,確定所述待擾動(dòng)語音樣本集中的優(yōu)先重合幀;所述優(yōu)先頻數(shù)用于從所述多個(gè)候選擾動(dòng)語音幀中確定被擾動(dòng)的語音幀,所述優(yōu)先重合幀表示被擾動(dòng)優(yōu)先級(jí)最高的語音幀;步驟5,根據(jù)所述優(yōu)先重合幀,確定所述待擾動(dòng)語音樣本集中的擾動(dòng)點(diǎn),初始化所述擾動(dòng)點(diǎn)對(duì)應(yīng)的擾動(dòng)值,并根據(jù)所述擾動(dòng)點(diǎn)和所述擾動(dòng)值,對(duì)所述待擾動(dòng)語音樣本集進(jìn)行擾動(dòng),得到擾動(dòng)結(jié)果;步驟6,計(jì)算所述擾動(dòng)結(jié)果與所述目標(biāo)說話人對(duì)應(yīng)的語音樣本集之間的損失值;步驟7,若所述損失值大于預(yù)設(shè)損失閾值,則利用投影梯度下降算法對(duì)所述擾動(dòng)點(diǎn)和所述擾動(dòng)值進(jìn)行更新,利用更新后的擾動(dòng)點(diǎn)和更新后的擾動(dòng)值,對(duì)所述擾動(dòng)結(jié)果進(jìn)行擾動(dòng),得到新擾動(dòng)結(jié)果,并將所述新擾動(dòng)結(jié)果作為所述步驟6中的擾動(dòng)結(jié)果,返回執(zhí)行步驟6;否則,將所述步驟5得到的擾動(dòng)結(jié)果作為所述當(dāng)前說話人對(duì)應(yīng)的語音對(duì)抗樣本;其中,所述步驟4包括:對(duì)所述待擾動(dòng)語音樣本集進(jìn)行復(fù)制,得到新待擾動(dòng)語音樣本集其中,{F1,F2,...,FH}表示所述待擾動(dòng)語音樣本集中的語音幀,H表示所述語音幀的總數(shù)量,每個(gè)所述語音幀包括C個(gè)采樣點(diǎn),XHC表示第H個(gè)語音幀中第C個(gè)采樣點(diǎn),Xorig表示當(dāng)前說話人uorig對(duì)應(yīng)的待擾動(dòng)語音樣本集;分別針對(duì)每個(gè)候選擾動(dòng)語音幀,將所述新待擾動(dòng)語音樣本集中所述候選擾動(dòng)語音幀對(duì)應(yīng)的采樣點(diǎn)設(shè)置為零;分別針對(duì)每個(gè)所述說話人識(shí)別模型,通過計(jì)算公式得到所述優(yōu)先度Psh;其中,Psh表示由第s個(gè)說話人識(shí)別模型計(jì)算得到第h個(gè)候選擾動(dòng)語音幀的優(yōu)先度,s=1,2,...,Q,Q表示預(yù)先設(shè)置的說話人識(shí)別模型的總數(shù)量,Q個(gè)說話人識(shí)別模型之間互不相同,h=1,2,...,L,L表示經(jīng)過所述步驟3處理后得到的候選擾動(dòng)語音幀的總數(shù)量,表示當(dāng)前說話人識(shí)別模型認(rèn)為語音樣本屬于uorig的置信度;通過計(jì)算公式 得到所述優(yōu)先頻數(shù)Ch;其中,Ch表示第h個(gè)候選擾動(dòng)語音幀的優(yōu)先頻數(shù),Csh表示說話人識(shí)別模型s對(duì)第h個(gè)候選擾動(dòng)語音幀的優(yōu)先頻數(shù),表示多個(gè)候選擾動(dòng)語音幀按照第s個(gè)說話人識(shí)別模型計(jì)算的優(yōu)先度從大到小排序后的集合,F(xiàn)t表示中索引為t的候選擾動(dòng)語音幀,Ωh表示由所述多個(gè)候選擾動(dòng)語音幀構(gòu)成的集合,Ωh={Fst,Fst+1,..,Fed},F(xiàn)st,Fst+1,..,Fed均表示所述候選擾動(dòng)語音幀,sort1參數(shù)1,參數(shù)2,參數(shù)3表示排序函數(shù),參數(shù)1表示進(jìn)行排序的集合,參數(shù)2表示比較參數(shù),參數(shù)3取值為1時(shí)表示按照比較參數(shù)從大到小對(duì)參數(shù)1表示的集合中的元素進(jìn)行排序,topk表示預(yù)先設(shè)置的擾動(dòng)點(diǎn)個(gè)數(shù);通過計(jì)算公式Ωorder=sortΩh,Ch,Ph,1,得到候選優(yōu)先重合幀集合Ωorder;其中,sort2參數(shù)1,參數(shù)2,參數(shù)3,參數(shù)4表示排序函數(shù),參數(shù)1表示進(jìn)行排序的集合,參數(shù)2表示第一排序條件,參數(shù)3表示第二排序條件,參數(shù)4取值為1時(shí)表示按照第一排序條件或第二排序條件對(duì)參數(shù)1表示的集合中的元素進(jìn)行排序,將候選優(yōu)先重合幀集合Ωorder中,前topk個(gè)候選優(yōu)先重合幀作為所述優(yōu)先重合幀。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中南大學(xué),其通訊地址為:410000 湖南省長沙市岳麓區(qū)麓山南路932號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 青島海爾滾筒洗衣機(jī)有限公司任海峰獲國家專利權(quán)
- 日產(chǎn)化學(xué)株式會(huì)社遠(yuǎn)藤歲幸獲國家專利權(quán)
- 睿鏃科技(北京)有限責(zé)任公司請(qǐng)求不公布姓名獲國家專利權(quán)
- 臺(tái)灣積體電路制造股份有限公司陳憲偉獲國家專利權(quán)
- 株式會(huì)社斯庫林集團(tuán)川口賢士獲國家專利權(quán)
- 深圳市銘濠科技有限公司李衛(wèi)華獲國家專利權(quán)
- 北京達(dá)佳互聯(lián)信息技術(shù)有限公司張寧獲國家專利權(quán)
- 華為技術(shù)有限公司鄭娟獲國家專利權(quán)
- 索尼公司F·盧塞克獲國家專利權(quán)
- 臺(tái)灣積體電路制造股份有限公司丁姮彣獲國家專利權(quán)


熱門推薦
- 廣州汽車集團(tuán)股份有限公司陳宗明獲國家專利權(quán)
- 硅存儲(chǔ)技術(shù)股份有限公司S·喬爾巴獲國家專利權(quán)
- 上海金鵬源輻照技術(shù)有限公司董凱豐獲國家專利權(quán)
- 廣東德洛斯照明工業(yè)有限公司楊和良獲國家專利權(quán)
- 北京百度網(wǎng)訊科技有限公司梁子豪獲國家專利權(quán)
- 西門子(中國)有限公司王海峰獲國家專利權(quán)
- 福建省晉華集成電路有限公司童宇誠獲國家專利權(quán)
- 南京圖玩智能科技有限公司史凱獲國家專利權(quán)
- 何哲彥獲國家專利權(quán)
- 通道福香米業(yè)有限公司胡世清獲國家專利權(quán)