恭喜珠海高凌信息科技股份有限公司姜拓獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜珠海高凌信息科技股份有限公司申請的專利基于深度學習復合模型的環境聲音識別方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117351995B 。
龍圖騰網通過國家知識產權局官網在2025-04-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311247442.1,技術領域涉及:G10L25/30;該發明授權基于深度學習復合模型的環境聲音識別方法及裝置是由姜拓;趙麗靜;于寧;鐘杰華;陳達峰;吳翠敏;母健康;曾二芳;彭小芳;曾洪生;宋衛華;徐從文;陶亞南設計研發完成,并于2023-09-25向國家知識產權局提交的專利申請。
本基于深度學習復合模型的環境聲音識別方法及裝置在說明書摘要公布了:本發明提出了一種基于深度學習復合模型的環境聲音識別方法及裝置,該方法包括:獲取環境音頻,對環境音頻進行特征提取得到環境音頻特征,將環境音頻特征輸入預先訓練好的復合模型,復合模型包括多個網絡結構不同的通用模型;通過通用模型識別出各個類別標簽對應的通用識別置信度;基于通用模型的模型權值和通用識別置信度,確定各個類別標簽的目標加權置信度作為通用模型的分類輸出結果;根據目標加權置信度的均值得到復合模型的輸出結果。根據本發明實施例的技術方案,能夠通過多個不同網絡結構的通用模型對環境音頻識別的置信度進行加權融合,能夠降低分類識別的過擬合風險,增強泛化能力,能夠在長期使用場景下維持對環境音頻識別的準確性。
本發明授權基于深度學習復合模型的環境聲音識別方法及裝置在權利要求書中公布了:1.一種基于深度學習復合模型的環境聲音識別方法,其特征在于,包括:獲取環境音頻,對環境音頻進行特征提取得到環境音頻特征,將環境音頻特征輸入預先訓練好的復合模型,其中,復合模型包括多個訓練好的通用模型,通用模型為DCNN網絡模型,每個通用模型的網絡結構不同,通用模型預設有多個類別標簽,通用模型預設有模型權值;遍歷復合模型,通過各個通用模型對環境音頻特征分別進行分類識別,得到各個通用模型的分類識別結果,分類識別結果包括各個類別標簽對應的通用識別置信度;基于通用模型的模型權值和通用識別置信度,確定各個類別標簽的目標加權置信度,將目標加權置信度確定為通用模型的分類輸出結果;根據全部的分類輸出結果確定復合模型的復合識別結果,其中,復合識別結果包括各個類別標簽的復合置信度,復合置信度為類別標簽所對應的全部的目標加權置信度的均值;至少一個通用模型還關聯有特例模型集合,特例模型集合包括至少一個特例模型,特例模型為DCNN網絡模型,每個特例模型的網絡結構不同,特例模型預設有多個類別標簽,特例模型的類別標簽為所歸屬的通用模型的類別標簽的真子集,特例模型的類別標簽預設有標簽權值,基于通用模型的模型權值和通用置信度,確定各個類別標簽的目標加權置信度,包括:將模型權值和通用識別置信度的乘積確定為通用加權置信度;將環境音頻特征輸入特例模型進行分類識別,得到特征模型輸出的特例識別結果,特例識別結果包括特例模型的各個類別標簽的特例識別置信度;將特例識別置信度與對應的標簽權值的乘積確定為特征加權置信度;當類別標簽關聯有特征加權置信度和通用加權置信度,將特征加權置信度和通用加權置信度的均值確定為目標加權置信度;或者,當類別標簽不存在關聯的特征加權置信度,將通用加權置信度確定為目標加權置信度。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人珠海高凌信息科技股份有限公司,其通訊地址為:519060 廣東省珠海市南屏科技工業園屏東一路1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。