恭喜中南大學姚鑫獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜中南大學申請的專利一種語音對抗樣本生成方法、裝置、終端設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117037843B 。
龍圖騰網通過國家知識產權局官網在2025-04-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311165130.6,技術領域涉及:G10L25/30;該發明授權一種語音對抗樣本生成方法、裝置、終端設備及介質是由姚鑫;王晨陽;趙明;唐楓梟;安森泉設計研發完成,并于2023-09-11向國家知識產權局提交的專利申請。
本一種語音對抗樣本生成方法、裝置、終端設備及介質在說明書摘要公布了:本申請適用于語音安全技術領域,提供了一種語音對抗樣本生成方法、裝置、終端設備及介質。該方法通過獲取待擾動語音樣本集;計算其他說話人與當前說話人之間的語音相似度,確定目標說話人;對待擾動語音樣本集進行語音端點檢測,得到候選擾動語音幀;計算優先度和優先頻數,確定優先重合幀;根據優先重合幀,確定待擾動語音樣本集中的擾動點和擾動值,對待擾動語音樣本集進行擾動,得到擾動結果;計算擾動結果與目標說話人對應的語音樣本集之間的損失值;利用投影梯度下降算法對擾動點和擾動值進行更新,將損失值小于預設損失閾值的擾動結果作為當前說話人對應的語音對抗樣本。本申請能夠提高身份去識別效果和語音合成質量。
本發明授權一種語音對抗樣本生成方法、裝置、終端設備及介質在權利要求書中公布了:1.一種語音對抗樣本生成方法,其特征在于,包括:步驟1,獲取當前說話人對應的待擾動語音樣本集,以及多個其他說話人對應的語音樣本集;步驟2,分別計算每個所述其他說話人與所述當前說話人之間的語音相似度,并從所述語音相似度小于預設相似度閾值的其他說話人中,確定出目標說話人;步驟3,對所述待擾動語音樣本集進行語音端點檢測,得到所述待擾動語音樣本集中的多個候選擾動語音幀;所述候選擾動語音幀用于確定被擾動的語音幀;步驟4,利用多個不同的說話人識別模型分別計算每個所述候選擾動語音幀對應的優先度和優先頻數,并根據所述優先頻數和所述優先度,確定所述待擾動語音樣本集中的優先重合幀;所述優先頻數用于從所述多個候選擾動語音幀中確定被擾動的語音幀,所述優先重合幀表示被擾動優先級最高的語音幀;步驟5,根據所述優先重合幀,確定所述待擾動語音樣本集中的擾動點,初始化所述擾動點對應的擾動值,并根據所述擾動點和所述擾動值,對所述待擾動語音樣本集進行擾動,得到擾動結果;步驟6,計算所述擾動結果與所述目標說話人對應的語音樣本集之間的損失值;步驟7,若所述損失值大于預設損失閾值,則利用投影梯度下降算法對所述擾動點和所述擾動值進行更新,利用更新后的擾動點和更新后的擾動值,對所述擾動結果進行擾動,得到新擾動結果,并將所述新擾動結果作為所述步驟6中的擾動結果,返回執行步驟6;否則,將所述步驟5得到的擾動結果作為所述當前說話人對應的語音對抗樣本;其中,所述步驟4包括:對所述待擾動語音樣本集進行復制,得到新待擾動語音樣本集其中,{F1,F2,...,FH}表示所述待擾動語音樣本集中的語音幀,H表示所述語音幀的總數量,每個所述語音幀包括C個采樣點,XHC表示第H個語音幀中第C個采樣點,Xorig表示當前說話人uorig對應的待擾動語音樣本集;分別針對每個候選擾動語音幀,將所述新待擾動語音樣本集中所述候選擾動語音幀對應的采樣點設置為零;分別針對每個所述說話人識別模型,通過計算公式得到所述優先度Psh;其中,Psh表示由第s個說話人識別模型計算得到第h個候選擾動語音幀的優先度,s=1,2,...,Q,Q表示預先設置的說話人識別模型的總數量,Q個說話人識別模型之間互不相同,h=1,2,...,L,L表示經過所述步驟3處理后得到的候選擾動語音幀的總數量,表示當前說話人識別模型認為語音樣本屬于uorig的置信度;通過計算公式 得到所述優先頻數Ch;其中,Ch表示第h個候選擾動語音幀的優先頻數,Csh表示說話人識別模型s對第h個候選擾動語音幀的優先頻數,表示多個候選擾動語音幀按照第s個說話人識別模型計算的優先度從大到小排序后的集合,Ft表示中索引為t的候選擾動語音幀,Ωh表示由所述多個候選擾動語音幀構成的集合,Ωh={Fst,Fst+1,..,Fed},Fst,Fst+1,..,Fed均表示所述候選擾動語音幀,sort1參數1,參數2,參數3表示排序函數,參數1表示進行排序的集合,參數2表示比較參數,參數3取值為1時表示按照比較參數從大到小對參數1表示的集合中的元素進行排序,topk表示預先設置的擾動點個數;通過計算公式Ωorder=sortΩh,Ch,Ph,1,得到候選優先重合幀集合Ωorder;其中,sort2參數1,參數2,參數3,參數4表示排序函數,參數1表示進行排序的集合,參數2表示第一排序條件,參數3表示第二排序條件,參數4取值為1時表示按照第一排序條件或第二排序條件對參數1表示的集合中的元素進行排序,將候選優先重合幀集合Ωorder中,前topk個候選優先重合幀作為所述優先重合幀。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中南大學,其通訊地址為:410000 湖南省長沙市岳麓區麓山南路932號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。