恭喜鄭州大學徐華興獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜鄭州大學申請的專利基于一維注意力機制卷積神經網絡音頻識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114187923B 。
龍圖騰網通過國家知識產權局官網在2025-05-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111611392.1,技術領域涉及:G10L25/51;該發明授權基于一維注意力機制卷積神經網絡音頻識別方法是由徐華興;田云志;李哲;胡飛;常加興設計研發完成,并于2021-12-27向國家知識產權局提交的專利申請。
本基于一維注意力機制卷積神經網絡音頻識別方法在說明書摘要公布了:本發明公開了一種基于一維注意力機制卷積神經網絡音頻識別方法,下載公開的音頻信號數據構建原始數據集;使用python代碼對原始數據集中的音頻信號進行分幀處理;建立并訓練一維注意力機制卷積神經網絡;最后通過集成學習將多個模型集成,形成最終的音頻識別模型。本發明優點在于采用了一維注意力機制卷積神經網絡進行音頻信號的識別,既克服了二維卷積神經網絡原始數據需求大,計算量大,且會丟失部分有用信息的問題,又克服了一維卷積神經網絡網絡性能不佳,分類效果較差的問題。通過實驗表明,本發明所述方法對公開數據集Urbansound8K上音頻信號識別的準確率可達93%左右,加入集成學習可達94%。
本發明授權基于一維注意力機制卷積神經網絡音頻識別方法在權利要求書中公布了:1.一種基于一維注意力機制卷積神經網絡音頻識別方法,其特征在于:包括以下步驟:S1,構建原始數據集;下載公開的音頻信號數據構建所述原始數據集;S2,數據預處理;使用python代碼對原始數據集中的所述音頻信號進行分幀處理;S3,建立一維注意力機制卷積神經網絡;所述一維注意力機制卷積神經網絡,是將注意力機制模塊集成到一維卷積神經網絡中;所述一維卷積神經網絡,包括輸入層、卷積層、激活函數、池化層、全連接層和Softmax層;所述注意力機制模塊,包括通道注意力機制模塊和時間注意力機制模塊;所述通道注意力機制模塊通過將所述卷積層各通道輸出的特征圖的特征信息進行聚合,為各通道的特征圖重新標定權重,通過不同的權重區分各通道特征圖的重要性,獲得所述一維卷積神經網絡中重要性高的通道,抑制重要性低的通道,自適應的改變各通道特征圖的權重;所述時間注意力機制模塊通過將所述卷積層各通道輸出的特征圖的特征信息進行聚合,以定位到和音頻信號相關的時間信號段;S4,訓練一維注意力機制卷積神經網絡;將原始數據集中的音頻信號按照訓練集:驗證集:測試集=8:1:1劃分為獨立的數據集;將所述訓練集中的音頻信號輸入所述一維注意力機制卷積神經網絡,選用Ranger神經網絡優化器,均方對數損失函數,余弦退火學習率完成一維注意力機制卷積神經網絡的訓練,得到多個模型;同時通過所述驗證集和所述測試集完成所述模型的驗證和測試;S5,通過集成學習將多個模型集成,形成最終的音頻識別模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人鄭州大學,其通訊地址為:450000 河南省鄭州市高新區科學大道100號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。