恭喜北京漢儀創新科技股份有限公司;上海驛創信息技術有限公司夏天獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京漢儀創新科技股份有限公司;上海驛創信息技術有限公司申請的專利基于結構化模型的習題抽取方法、系統、設備和介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117648453B 。
龍圖騰網通過國家知識產權局官網在2025-03-21發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311555222.5,技術領域涉及:G06F16/535;該發明授權基于結構化模型的習題抽取方法、系統、設備和介質是由夏天設計研發完成,并于2023-11-21向國家知識產權局提交的專利申請。
本基于結構化模型的習題抽取方法、系統、設備和介質在說明書摘要公布了:本公開涉及基于結構化模型的習題抽取方法、系統、設備和介質,所述方法包括如下步驟:獲取用戶輸入的習題圖像,對用戶輸入的習題圖像進行目標檢測,檢測出文本內容、圖表內容和排版區域;對檢測出的文本內容進行識別得到文本識別結果,將文本識別結果與所述檢測出的排版區域相結合,根據排版規律進行文章拼接;將拼接完的文章與所述圖表內容送入結構化模型中,通過結構化模型分析抓取習題內容,并對習題內容進行結構化處理得到習題精細結構化結果。本公開針對不同的題型定義了不同的輸出格式,并在結構化模型的輸出中定義每個題型的屬性,保證了輸出結果的結構化精細程度,同時提高了習題抽取的效率與準確性。
本發明授權基于結構化模型的習題抽取方法、系統、設備和介質在權利要求書中公布了:1.基于結構化模型的習題抽取方法,其特征在于,包括如下步驟:獲取用戶輸入的習題圖像,對用戶輸入的習題圖像進行目標檢測,檢測出文本內容、圖表內容和排版區域,所述文本內容包括如下類型中的至少一種:文本或公式;所述圖表內容包括如下類型中的至少一種:圖片、表格或二維碼;對檢測出的文本內容進行識別得到文本識別結果,將文本識別結果與所述檢測出的排版區域相結合,根據排版規律進行文章拼接;所述對檢測出的文本內容進行識別包括文本識別和公式識別;所述根據排版規律進行文章拼接,包括:通過位置關系對文本和公式進行排序,根據排版規律,按照從左到右、從上到下的閱讀順序將識別結果拼接為一篇文章;所述通過位置關系對文本和公式進行排序,包括:在段落內部,通過位置關系計算每個文本和公式之間的水平和垂直,進行段落內部的排序;將拼接完的文章與所述圖表內容送入結構化模型中,通過結構化模型分析抓取習題內容,并對習題內容進行結構化處理得到習題精細結構化結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京漢儀創新科技股份有限公司;上海驛創信息技術有限公司,其通訊地址為:100089 北京市海淀區翠微路2號院五區2號樓二層201;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。