恭喜京東科技信息技術有限公司雪巍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜京東科技信息技術有限公司申請的專利一種語音識別方法和裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114550702B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210312961.0,技術領域涉及:G10L15/02;該發明授權一種語音識別方法和裝置是由雪巍;范璐;丁國宏設計研發完成,并于2022-03-28向國家知識產權局提交的專利申請。
本一種語音識別方法和裝置在說明書摘要公布了:本發明公開了一種語音識別方法和裝置,涉及計算機技術領域。該方法的一具體實施方式包括:通過特征提取網絡提取無標注的第一音頻數據樣本對應的預訓練特征,基于該預訓練特征通過特征映射網絡得到第一音頻數據樣本的音素的歸一化權重向量;以歸一化權重向量作為第一音頻數據樣本對應的訓練目標以及以有標注的第二音頻數據樣本的標簽作為第二音頻數據樣本對應的訓練目標,訓練語音識別模型,利用訓練后的語音識別模型進行語音識別。該實施方式能夠解決語音識別的數據依賴和語音表征問題,有效利用語音識別產品中無標注音頻數據來提高語音識別性能,降低人工標注成本,解決現有技術忽略語音相位信息和對復雜語音特性建模能力存在缺陷的問題。
本發明授權一種語音識別方法和裝置在權利要求書中公布了:1.一種語音識別方法,其特征在于,包括:通過特征提取網絡提取無標注的第一音頻數據樣本對應的預訓練特征,基于所述第一音頻數據樣本對應的預訓練特征,通過特征映射網絡得到所述第一音頻數據樣本的音素的歸一化權重向量,所述歸一化權重向量表示所述第一音頻數據樣本的音素的類別;以所述歸一化權重向量作為所述第一音頻數據樣本對應的訓練目標,以及,以有標注的第二音頻數據樣本的標簽作為所述第二音頻數據樣本對應的訓練目標,利用所述第一音頻數據樣本和所述第二音頻數據樣本訓練語音識別模型,以利用訓練后的語音識別模型進行語音識別,其中,所述第二音頻數據樣本的標簽表示所述第二音頻數據樣本的音素的類別;所述方法還包括:在訓練特征映射網絡之前,通過如下步驟訓練特征提取網絡:利用無標注的第四音頻數據樣本構造所述特征提取網絡的訓練樣本,其中每多個訓練樣本組合得到一個訓練樣本子集合;將所述訓練樣本子集合輸入所述特征提取網絡,得到對應所述訓練樣本子集合中每一訓練樣本的網絡輸出結果;對對應各訓練樣本的網絡輸出結果進行聚類,得到訓練樣本與聚類中心的配對組合,并根據所述配對組合更新所述聚類中心;以聚類準則函數作為所述特征提取網絡訓練時的損失函數,通過反向傳播更新所述特征提取網絡的網絡參數,所述聚類準則函數是根據所述網絡輸出結果和所述聚類中心構建的。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人京東科技信息技術有限公司,其通訊地址為:100176 北京市北京經濟技術開發區科創十一街18號院2號樓6層601;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。