恭喜北京聲智科技有限公司李良斌獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京聲智科技有限公司申請的專利語音識別方法、裝置、設備、可讀存儲介質及計算機程序獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114171014B 。
龍圖騰網通過國家知識產權局官網在2025-06-10發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111459909.X,技術領域涉及:G10L15/07;該發明授權語音識別方法、裝置、設備、可讀存儲介質及計算機程序是由李良斌;陳孝良設計研發完成,并于2021-12-02向國家知識產權局提交的專利申請。
本語音識別方法、裝置、設備、可讀存儲介質及計算機程序在說明書摘要公布了:本申請公開了一種語音識別方法、裝置、設備、可讀存儲介質及計算機程序,屬于計算機技術領域。通過本申請實施例提供的技術方案,獲取語音數據;調用聲紋識別模型,對該語音數據和語音特征集進行處理,以確定與該語音數據匹配的目標用戶,語音特征集中存儲有多個用戶的歷史語音特征;在對該語音數據進行解碼的過程中,調用與目標用戶匹配的目標語言模型對該語音數據進行處理,以得到該語音數據對應的目標文本,其中,目標語言模型基于目標用戶的歷史文本數據訓練得到;輸出該語音數據對應的目標文本。該技術方案能夠提高語音識別的準確率。
本發明授權語音識別方法、裝置、設備、可讀存儲介質及計算機程序在權利要求書中公布了:1.一種語音識別方法,其特征在于,所述方法包括:獲取語音數據;調用聲紋識別模型,對所述語音數據和語音特征集進行處理,以確定與所述語音數據匹配的目標用戶,所述語音特征集中存儲有多個用戶的歷史語音特征;調用聲學模型,將所述語音數據輸入聲學模型,得到所述語音數據對應的多組音素;基于所述多組音素,在發音詞典中確定與所述多組音素分別對應的多個候選字或候選詞;調用目標語言模型,將所述多個候選字或候選詞輸入與所述目標用戶匹配的目標語言模型中,得到并輸出所述語音數據對應的目標文本,其中,所述目標語言模型基于所述目標用戶的歷史文本數據訓練得到;當所述目標用戶的個數為M個時,則服務器調用每個目標用戶的目標語言模型,分別對所述語音數據進行處理,得到M個候選文本,每個候選文本分別對應一個識別分數,將識別分數最高的候選文本確定為所述目標文本,所述識別分數基于音素分數、字詞分數和文本分數確定,所述聲學模型輸出的每組音素信息分別對應有所述音素分數;基于發音詞典確定的多個候選字或候選詞分別對應有所述字詞分數;所述目標語言模型輸出的文本對應有所述文本分數;輸出所述語音數據對應的目標文本;所述方法還包括:若未從所述語音特征集中匹配出所述目標用戶,則將所述語音數據作為新增用戶的語音數據添加至歷史語音數據集中;當所述歷史語音數據集中所述新增用戶的數量大于第一數量,且每個所述新增用戶的語音數據量大于第二數量時,對每個所述新增用戶的多條語音數據進行特征提取,得到每個所述新增用戶的多個語音特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京聲智科技有限公司,其通訊地址為:100094 北京市海淀區北清路81號院一區1號樓6層601;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。