恭喜清華大學蘇州汽車研究院(相城)姜彥吉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜清華大學蘇州汽車研究院(相城)申請的專利一種語音數據的處理方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114913870B 。
龍圖騰網通過國家知識產權局官網在2025-06-10發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210511095.8,技術領域涉及:G10L21/0272;該發明授權一種語音數據的處理方法、裝置、設備及存儲介質是由姜彥吉;邱友利;蘇航;陳敏;鄭四發設計研發完成,并于2022-05-11向國家知識產權局提交的專利申請。
本一種語音數據的處理方法、裝置、設備及存儲介質在說明書摘要公布了:本發明公開了一種語音數據的處理方法、裝置、設備及存儲介質。該方法包括:獲取待分離語音數據,并對待分離語音數據進行特征提取,得到待分離語音特征;按照預設塊長和預設步長對待分離語音特征進行分段,得到至少兩個語音分塊特征;通過塊內處理單元提取各語音分塊特征的第一維度特征;和,通過塊間處理單元提取各語音分塊特征的第二維度特征;融合各語音分塊特征的第一維度特征和第二維度特征,以得到至少兩個語音預測特征;根據各語音預測特征和待分離語音特征,確定各語音分離結果。本技術方案解決了基于時域的分離方法語音分離信噪比低的問題,可以在提升信噪比的同時,降低模型參數,進而達到良好的語音分離效果。
本發明授權一種語音數據的處理方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種語音數據的處理方法,其特征在于,所述方法包括:獲取待分離語音數據,并通過特征提取器對所述待分離語音數據進行特征提取,得到待分離語音特征;通過分離器,按照預設塊長和預設步長對所述待分離語音特征進行分段,得到至少兩個語音分塊特征;通過所述分離器的塊內處理單元提取各語音分塊特征的第一維度特征;和,通過所述分離器的塊間處理單元提取各語音分塊特征的第二維度特征;通過所述分離器融合各語音分塊特征的第一維度特征和第二維度特征,以得到至少兩個語音預測特征;通過波形重構器,根據各語音預測特征和所述待分離語音特征,確定各語音分離結果;其中,所述塊內處理單元包括塊內變換子單元;所述第一維度特征為塊內依賴特征;相應的,所述通過所述分離器的塊內處理單元提取各語音分塊特征的第一維度特征,包括:將各語音分塊特征輸入至所述塊內處理單元,通過所述塊內變換子單元基于預設塊長提取各語音分塊特征的塊內依賴特征;所述塊間處理單元包括塊間變換子單元;所述第二維度特征為塊間依賴特征;相應的,所述通過所述分離器的塊間處理單元提取各語音分塊特征的第二維度特征,包括:將各語音分塊特征和對應的塊內依賴特征相加作為輸入數據輸入至所述塊間處理單元,通過所述塊間變換子單元基于預設塊長和預設步長提取各語音分塊特征的塊間依賴特征;所述分離器還包括疊加單元和門控單元;相應的,所述通過所述分離器融合各語音分塊特征的第一維度特征和第二維度特征,以得到至少兩個語音預測特征,包括:將各塊內依賴特征和匹配的塊間依賴特征相加,得到各融合特征;將各融合特征輸入至所述疊加單元,得到合并特征;將所述合并特征輸入至所述門控單元,得到至少兩個語音預測特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人清華大學蘇州汽車研究院(相城),其通訊地址為:215134 江蘇省蘇州市相城區高鐵新城太陽路2266號5幢;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。