恭喜四川譯訊信息科技有限公司馬萬炯獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜四川譯訊信息科技有限公司申請的專利一種基于分塊并行的超大幅面文檔智能識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119625766B 。
龍圖騰網通過國家知識產權局官網在2025-05-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510152368.8,技術領域涉及:G06V30/41;該發明授權一種基于分塊并行的超大幅面文檔智能識別方法及系統是由馬萬炯;薛志毅;蔣巧蘭;張藝設計研發完成,并于2025-02-12向國家知識產權局提交的專利申請。
本一種基于分塊并行的超大幅面文檔智能識別方法及系統在說明書摘要公布了:本發明提供了一種基于分塊并行的超大幅面文檔智能識別方法及系統,包括以下步驟:獲取待識別文檔的圖像數據;采用自適應分塊策略,根據系統可用內存或者圖像特征進行動態分塊,相鄰塊之間保持一定的重疊區域,再將分塊任務轉化為異步任務隊列;使用線程池并行處理各個分塊,或者采用分布式計算架構將任務分配到多個計算節點上執行;檢測文本區域和表格結構,通過文本識別模型對檢測到的文本區域進行文本識別;收集各個分塊的處理結果,根據記錄的位置信息進行合并;根據文本識別模型輸出的識別結果進行置信度打分來優化文本區域,對優化后的文本進行可視化處理和版面分析,生成標準格式的輸出結果。
本發明授權一種基于分塊并行的超大幅面文檔智能識別方法及系統在權利要求書中公布了:1.一種基于分塊并行的超大幅面文檔智能識別方法,其特征在于,包括以下步驟:A、圖像數據預處理獲取待識別文檔的圖像數據,并采用圖像增強策略,以提高原始圖像的質量;B、圖像分塊處理采用自適應分塊策略,根據系統可用內存或者圖像特征進行動態分塊,相鄰塊之間保持一定的重疊區域以確保文本的完整性,再將分塊任務轉化為異步任務隊列;C、并行文本檢測與識別使用線程池并行處理各個分塊,或者采用分布式計算架構將任務分配到多個計算節點上執行;檢測文本區域和表格結構,并記錄其相對位置信息,通過文本識別模型對檢測到的文本區域進行文本識別;D、結果合并與結構重建收集各個分塊的處理結果,根據記錄的位置信息進行合并,對于跨越多個分塊的文本,通過分析重疊區域的內容進行文本重組;E、后處理優化與輸出根據文本識別模型輸出的識別結果進行置信度打分來優化文本區域,對優化后的文本進行可視化處理和版面分析,生成標準格式的輸出結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人四川譯訊信息科技有限公司,其通訊地址為:610000 四川省成都市自由貿易試驗區高新區天府五街200號2棟A區10樓1011-2室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。