恭喜華南理工大學黃雙萍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜華南理工大學申請的專利基于空間位置與場景關聯的文本檢測識別模型校準方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119516530B 。
龍圖騰網通過國家知識產權局官網在2025-05-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411580630.0,技術領域涉及:G06V20/62;該發明授權基于空間位置與場景關聯的文本檢測識別模型校準方法是由黃雙萍;徐可可;彭政華;黃森設計研發完成,并于2024-11-07向國家知識產權局提交的專利申請。
本基于空間位置與場景關聯的文本檢測識別模型校準方法在說明書摘要公布了:本發明公開了基于空間位置與場景關聯的文本檢測識別模型校準方法,包括:根據目標文本序列的似然最大化和目標位置的絕對距離最小化對端到端文本檢測識別模型進行監督獲得識別損失;通過文本關聯序列挖掘模型構建文本關聯序列集;通過空間位置平滑方法構建文本平滑位置集;根據文本關聯序列集聯合正則內容損失實現文本內容置信度校準;根據文本平滑位置集聯合正則位置損失實現文本位置置信度校準;引入全局校準強度系數聯合正則內容損失和正則位置損失構建正則化損失函數,實現總體的可控性端到端置信度校準;聯合識別損失和正則化損失得到最終損失以訓練得到校準后的端到端文本檢測識別模型,用于輸出預測文本序列、位置及校準的置信度。
本發明授權基于空間位置與場景關聯的文本檢測識別模型校準方法在權利要求書中公布了:1.基于空間位置與場景關聯的文本檢測識別模型校準方法,其特征在于,包括以下步驟:步驟1,根據目標文本序列的似然最大化和目標文本位置的絕對距離最小化的訓練范式對端到端文本檢測識別模型進行監督,分別獲得文本內容損失和文本位置損失并結合獲得識別損失;步驟2,通過場景感知的文本關聯序列挖掘模型獲取文本關聯序列,構建實例特定的與當前場景更為貼合的文本關聯序列集;步驟3,通過空間位置平滑方法對目標文本位置進行空間平滑獲取文本平滑位置,構建實例特定的文本平滑位置集;步驟4,根據場景感知的文本關聯序列集,聯合正則內容損失,約束目標文本序列似然最大化,實現場景有效的文本內容置信度校準;步驟5,根據文本平滑位置集,聯合正則位置損失,約束目標文本位置的絕對距離最小化,實現文本位置置信度校準;步驟6,引入全局校準強度系數,聯合正則內容損失和正則位置損失,構建空間位置平滑與場景感知關聯正則化損失函數,實現總體的可控性端到端置信度校準;步驟7,聯合識別損失和正則化損失得到最終損失,利用最終損失重新訓練待校準訓練模型,最后得到校準后的端到端文本檢測識別模型,用于輸出預測文本序列、預測文本位置及校準的置信度;所述場景感知的文本關聯序列挖掘模型包括編碼器和解碼器,所述編碼器包括位置嵌入層、位置注意力網絡、標記嵌入層和全局圖像編碼器;通過位置嵌入層將字符標記順序編碼為位置嵌入表示,為時間步;單個文本實例圖像經過位置注意力網絡處理后得到當前時間步的視覺特征嵌入,該視覺特征嵌入與位置嵌入和模態嵌入結合得到感知表示;目標文本序列通過標記嵌入層被編碼為語義標記特征嵌入,該語義標記特征嵌入與位置嵌入和模態嵌入結合得到語義表示;場景文本圖像通過全局圖像編碼器提取出場景文本圖像中的全局特征序列表示;再將感知表示、語義表示和全局特征序列表示拼接在一起并作為鍵和值進行連接,隨后通過修改解碼器中的注意力掩碼,查詢在不同時間步內選擇性地與不同的特征嵌入進行交互,從而影響預測分布并搜索不同類型的相關文本關聯序列集。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華南理工大學,其通訊地址為:510000 廣東省廣州市天河區五山路381號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。