恭喜華南理工大學胡勁松獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜華南理工大學申請的專利一種面向電力調度領域的語音識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114822544B 。
龍圖騰網通過國家知識產權局官網在2025-04-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210298443.8,技術領域涉及:G10L15/26;該發明授權一種面向電力調度領域的語音識別方法是由胡勁松;馮思銘;李文亮;王釗越;賀映玲設計研發完成,并于2022-03-25向國家知識產權局提交的專利申請。
本一種面向電力調度領域的語音識別方法在說明書摘要公布了:本發明公開了一種面向電力調度領域的語音識別方法,用于識別電力調度過程中的語音命令和對話。電力調度中通常涉及大量的電力專業術語以及各個電力部門特有的地名、線路、電站、特定編號的設備名乃至人名,因而常用的語音識別方法錯誤率比較高,本發明提出差頻原理,自動建立本地電力差頻專用詞庫,以差頻專用詞匯為中心匹配拼音與文字,采用任意位置轉換機制。通過這些步驟,可以在無專用語音庫供模型訓練的前提下就獲得高準確率的識別效果,特別是能識別本地電力部門的專用詞匯。
本發明授權一種面向電力調度領域的語音識別方法在權利要求書中公布了:1.一種面向電力調度領域的語音識別方法,其特征在于,包括:級別優先匹配:語音轉拼音后得到字母和音調組成的一個拼音串,設其名為A,A變成文字的過程中,優先與差頻專用詞庫的一級子庫詞匯的拼音匹配,匹配成功則A的部分拼音變成文字,匹配不成功再考慮下一級,直到最后一級子庫,所述匹配即求A的一部分拼音和某個中文詞組或字的正確拼音之間的相似度,也簡稱為拼音與文字或詞匯的匹配;所述差頻專用詞庫由分級的專用詞匯及其拼音組成,詞匯的級別由其兩個頻率的差異決定,即在專用資料中出現的頻率越高該詞匯級別越高,而在通用資料中出現的頻率越高該詞匯級別越低,所述詞匯指中文詞組,一個中文詞組包括至少2個中文字,所述專用詞匯包括本地專用詞匯和專業術語,所述本地專用詞匯指僅在本機、本地局域網、一個特定的地域、群體或部門中使用的詞匯,同級別的專用詞匯構成一個子庫,最高級子庫為一級子庫,以下依次為二級到最低級子庫;頻率優先匹配:在級別優先匹配完成之后,對A余下的拼音與通用詞匯的拼音進行匹配,通用資料中出現的頻率高的非專用詞匯優先匹配,最后余下的拼音與單個中文字的拼音匹配;所述差頻專用詞庫的構建,包括以下步驟:S1、采集專用資料的詞匯,包括本地電力調度日志、工作票、設備記錄和通話文本,并搜索網絡上的電力專業學術文章;S2、對上一步所采集的專用資料的詞匯進行清理、分詞操作,獲得詞匯列表,接著對詞匯列表進行詞頻統計,得到專用詞頻詞典;其中,詞頻=該詞重復的次數×該詞長度全部資料總字數,所述專用詞頻詞典包含了專用資料中出現的全部詞匯及其詞頻;S3、采集通用資料的詞匯,包括人民日報語料庫及新浪、搜狐、網易三大網站的新聞,進行詞匯詞頻統計,得到通用詞頻詞典,包含了通用資料中出現的全部詞匯及其詞頻;S4、對專用詞頻詞典的每個詞匯做差頻操作,得到差頻專用詞庫,所述差頻操作即:差頻值一個詞匯的專用詞頻-k×其通用詞頻,此處k為固定的系數,專用詞頻和通用詞頻分別由專用詞頻詞典和通用詞頻詞典得到,詞典中查不到的詞匯,其詞頻計為0;S5、將差頻值排名前25%的詞匯存入一級子庫,26%至50%的詞匯存入二級子庫,51%至75%的詞匯存入三級子庫,其它大于0的詞匯存入四級,差頻值小于或等于0的舍去;S6、為差頻專用詞庫中每一個詞匯關聯其對應的拼音,最終形成面向電力調度的差頻專用詞庫;所述差頻專用詞庫由一、二、三、四級子庫組成,差頻值越高的詞匯在子庫排隊越前面。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華南理工大學,其通訊地址為:510640 廣東省廣州市天河區五山路381號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。