恭喜浙江工業大學毛科技獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜浙江工業大學申請的專利一種基于特征融合的語音情感識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114495990B 。
龍圖騰網通過國家知識產權局官網在2025-05-06發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210217251.X,技術領域涉及:G10L25/63;該發明授權一種基于特征融合的語音情感識別方法是由毛科技;武佳男;錢升港;張拓;毛嚴設計研發完成,并于2022-03-07向國家知識產權局提交的專利申請。
本一種基于特征融合的語音情感識別方法在說明書摘要公布了:一種基于特征融合的語音情感識別方法,包括:步驟1數據獲取與預處理;步驟2輸入本發明中設計的基于特征融合的語音情感識別網絡進行情感識別;步驟3獲得情感識別結果。本發明利用分類層特征融合的方法對語音情感進行識別,設計并實現了一種將MFCC梅爾頻率倒譜系數的深層特征與傳統的聲學特征相融合的方法,用分類層特征融合算法將MFCC深層特征與過零率、梅爾頻率、頻譜質心進行融合,通過指定的決策融合規則對輸出的識別結果進行融合計算,最后選擇概率分布中概率最大的作為識別結果。該發明對語音情感識別,具有較大地應用價值。
本發明授權一種基于特征融合的語音情感識別方法在權利要求書中公布了:1.一種基于特征融合的語音情感識別方法,包括以下步驟:步驟1:獲取及預處理用戶語音數據,使用python庫函數librosa.load函數讀取需要情感識別的語音,保存為numpy數據類型,通過構造預加重函數以及加窗分幀函數對其進行預處理;步驟2:將數據放入特征提取器中,提取以下四種特征用于后續對特征的深度提取及融合,具體步驟如下:1使用python庫函數librosa.feature.zero_crossing_rate函數提取已保存數據的過零率;2使用python庫函數librosa.feature.melspectrogram函數提取已保存數據的梅爾頻率;3使用python庫函數librosa.feature.spectral_centroid函數提取已保存數據的頻譜質心;4使用python庫函數librosa.feature.mfcc函數提取已保存數據的梅爾頻率倒譜系數MFCC;步驟3:輸入語音情感識別網絡進行情感識別;所述的語音情感識別網絡包括深度特征提取子網、分類器、分類層特征融合:所述的深度特征提取子網是將上述的MFCC送入卷積神經網絡CNN中,對該特征進行卷積操作以獲取深層特征,該網絡結構包括四個卷積部分,每個卷積部分包括一個卷積層、一個池化層、一個歸一化層和一個Dropout層,經過該網絡的卷積操作得到深層特征;所述的分類器采用的損失函數是交叉熵損失函數,用該函數來衡量預測值和真實值分布的差異,并將語音的情感劃分到中性、生氣、害怕、高興、悲傷、厭惡、無聊這七種情感中;所述的分類層特征融合是根據特征提取器所提取出的語音特征以及深度特征提取子網得到的深度特征進行特征融合,該部分采用的是分類層特征融合算法;基于分類層的特征融合算法先對語音信號提取的特征類別記為n類,將這n類特征分別輸入到n個分類器中進行訓練,再用測試數據得到m類分類結果,測試數據的識別概率用{PijK,i=1Ln,j=1Lm}表示,再根據指定的決策融合規則對這些識別結果進行融合計算,最后得到m種不同分類結果的概率分布,表示為{qjK,j=1Lm},根據決策融合得到的新的判決概率qjK的計算方式采用公式1: 其中,j代表第j個測試數據,q′jK的計算方式為公式2:q′jK=RpijK2這里的R函數表示的是分類層融合的規則,最后根據判決概率計算得到的預測標簽3:lK=argmaxqjK3 該分類層特征融合算法判決規則使用的是求和方式,如公式4所示;步驟4:獲得語音情感識別結果;根據步驟3提供的概率分布情況,在這些分類結果集合中選擇概率最大的作為最后的分類結果,將識別結果對應到中性、生氣、害怕、高興、悲傷、厭惡、無聊這七種情感中。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工業大學,其通訊地址為:310014 浙江省杭州市拱墅區潮王路18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。