恭喜國家電網有限公司信息通信分公司李曉勐獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜國家電網有限公司信息通信分公司申請的專利一種用于音視頻的OCR識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119007181B 。
龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411257822.8,技術領域涉及:G06V20/62;該發明授權一種用于音視頻的OCR識別方法及系統是由李曉勐;彭元龍;胡威;袁洲;盧騰;崔兆偉;李清波;張大偉;魏家輝;林冰潔;夏昂;王子萌;李慧敏;劉孟奇;石進;李成巍;劉俊文;閆珺路;曹耀夫;趙景程;李鳳來設計研發完成,并于2024-09-09向國家知識產權局提交的專利申請。
本一種用于音視頻的OCR識別方法及系統在說明書摘要公布了:本申請涉及圖像處理識別技術領域,具體涉及一種用于音視頻的OCR識別方法及系統,該方法包括:提取各當前幀的灰度圖中的潛在漢字區域;確定各當前幀中每個潛在漢字區域的漢字確信度;根據各當前幀中每個潛在漢字區域與其對比區域的兩目標區域中所有像素點的灰度值的平均分布情況之間的差異,結合所述漢字確信度,構建各當前幀中每個潛在漢字區域的漢字評估指數,以實現音視頻的文字識別。本申請基于漢字區域的形態紋理特征及視頻數據所具備的時空上下文特征,以調整神經網絡的訓練參數,提高對音視頻中字符識別的準確度和神經網絡模型的訓練精度。
本發明授權一種用于音視頻的OCR識別方法及系統在權利要求書中公布了:1.一種用于音視頻的OCR識別方法,其特征在于,該方法包括以下步驟:獲取音視頻中各當前幀的灰度圖;通過邊緣檢測及連通域分析提取各當前幀灰度圖中的潛在漢字區域及其內的筆畫線;以各當前幀中每個潛在漢字區域的最小外接矩形的對角線交點為中心劃分局部范圍;根據各當前幀中每個潛在漢字區域的最小外接矩形的大小和局部范圍內潛在漢字區域的數量,以及各當前幀中每個潛在漢字區域的筆畫線上所有像素點到各自最近的潛在漢字區域邊緣的距離,以確定各當前幀中每個潛在漢字區域的漢字確信度;各當前幀中每個潛在漢字區域的局部范圍中距離局部范圍的中心像素點最近的潛在漢字區域,記為各當前幀中每個潛在漢字區域的目標區域;后一幀中距離其當前幀中每個潛在漢字區域的中心像素點最近的潛在漢字區域,記為各當前幀中每個潛在漢字區域的對比區域;所述各當前幀中每個潛在漢字區域的漢字評估指數的構建過程為:分析各當前幀中每個潛在漢字區域的目標區域中所有像素點的灰度值的均值,記為各當前幀中每個潛在漢字區域的目標區域的第一均值;各當前幀中每個潛在漢字區域的關聯偏差為各當前幀中每個潛在漢字區域與其對比區域的兩目標區域的第一均值間的差異;根據各當前幀中每個潛在漢字區域的漢字確信度確定各當前幀中每個潛在漢字區域的確信評估指數,所述各當前幀中每個潛在漢字區域的漢字評估指數為各當前幀中每個潛在漢字區域的確信評估指數與關聯偏差的比值。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人國家電網有限公司信息通信分公司,其通訊地址為:100032 北京市西城區白廣路二條一號綜合樓2307房間;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。