恭喜杭州恒生聚源信息技術有限公司;上海恒生聚源數據服務有限公司于業達獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜杭州恒生聚源信息技術有限公司;上海恒生聚源數據服務有限公司申請的專利表格識別方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119360401B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411909603.3,技術領域涉及:G06V30/412;該發明授權表格識別方法、裝置、設備及存儲介質是由于業達;楊祎聰;劉奕晨;廖祝勝;譚傅倫設計研發完成,并于2024-12-24向國家知識產權局提交的專利申請。
本表格識別方法、裝置、設備及存儲介質在說明書摘要公布了:本申請提供了一種表格識別方法、裝置、設備及存儲介質,方法包括:基于仿射變換模型對原始表格圖像進行傾斜校正得到校正后表格圖像,對校正后表格圖像進行文字檢測,得到原始表格文本信息,基于語義重組模型對原始表格文本信息中的原始表格文本進行文本重組,得到多個重組后表格文本特征,將校正后表格圖像和多個重組后表格文本特征輸入目標檢測模型中,得到校正后表格圖像中各單元格的起止位置坐標和起止行列,根據各單元格的起止位置坐標和起止行列,識別得到表格信息。通過本申請能夠提升表格傾斜校正的準確率及泛化性,并提升復雜單元格的識別準確率以及表格信息的準確率。
本發明授權表格識別方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種表格識別方法,其特征在于,所述方法包括:基于預先訓練得到的仿射變換模型對原始表格圖像進行傾斜校正,得到校正后表格圖像;對所述校正后表格圖像進行文字檢測,得到原始表格文本信息,所述原始表格文本信息中至少包括:原始表格文本;基于預先訓練得到的語義重組模型對所述原始表格文本進行文本重組,得到多個重組后表格文本特征,其中,所述重組后表格文本特征用于表征重組的表格文本,若所述原始表格文本中存在跨行文本段,則所述跨行文本段在所述重組的表格文本中處于同一語段,在所述重組后表格文本特征所表征的表格文本中,同一單元格中原本被分割開的跨行文本段被重組為處于同一語段的文本,使得重組后表格文本特征與原始表格中的實際語義一致,其中,所述語段為按照語義劃分的文本,一個語段中包括一個或者多個文本段;將所述校正后表格圖像和所述多個重組后表格文本特征輸入預先訓練得到的目標檢測模型中,由所述目標檢測模型對所述校正后表格圖像進行特征提取,得到多個圖像特征;根據多個圖像特征和多個重組后表格文本特征的相似度,對各所述圖像特征進行語義增強,得到多個加權圖像特征;對所述多個加權圖像特征進行編碼和解碼處理,得到所述校正后表格圖像中各單元格的起止位置坐標和起止行列;根據各所述單元格的所述起止位置坐標和所述起止行列,識別得到所述原始表格圖像中的表格信息。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州恒生聚源信息技術有限公司;上海恒生聚源數據服務有限公司,其通訊地址為:310018 浙江省杭州市錢塘區白楊街道科技園路2號2幢1701-1714室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。