恭喜杭州海康威視數字技術股份有限公司遲子秋獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜杭州海康威視數字技術股份有限公司申請的專利描述生成模型訓練方法、描述生成方法、裝置及電子設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119810593B 。
龍圖騰網通過國家知識產權局官網在2025-06-03發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510285822.7,技術領域涉及:G06V10/774;該發明授權描述生成模型訓練方法、描述生成方法、裝置及電子設備是由遲子秋;李逸飛;黃博;王金設計研發完成,并于2025-03-11向國家知識產權局提交的專利申請。
本描述生成模型訓練方法、描述生成方法、裝置及電子設備在說明書摘要公布了:本申請實施例提供了一種描述生成模型訓練方法、描述生成方法、裝置及電子設備,涉及計算機視覺技術領域,描述生成模型訓練方法包括:利用第一文本提示以及描述生成模型,對每一第一樣本圖像進行處理,得到該第一樣本圖像中指定圖像區域的描述文本,作為第一樣本描述文本;從各第一樣本描述文本中,確定與對應的第一樣本圖像中指定圖像區域相匹配的第二樣本描述文本;將每一第二樣本描述文本對應的第一樣本圖像和第一文本提示輸入描述生成模型,得到該第一樣本圖像中指定圖像區域的第一預測描述文本;基于第一預測描述文本與第二樣本描述文本之間的差異,對描述生成模型的參數進行調整,得到新的描述生成模型。可以準確地生成圖像區域的描述文本。
本發明授權描述生成模型訓練方法、描述生成方法、裝置及電子設備在權利要求書中公布了:1.一種描述生成模型訓練方法,其特征在于,所述方法包括:利用第一文本提示以及當前的描述生成模型,對當前的每一第一樣本圖像進行處理,得到用于描述該第一樣本圖像中指定圖像區域的描述文本,作為當前的第一樣本描述文本;其中,所述第一文本提示用于指示生成輸入的圖像中指定圖像區域的描述文本;從當前的各第一樣本描述文本中,確定與對應的第一樣本圖像中指定圖像區域相匹配的描述文本,作為當前的第二樣本描述文本;將當前的每一第二樣本描述文本對應的第一樣本圖像和所述第一文本提示輸入當前的描述生成模型,得到該第一樣本圖像中指定圖像區域的描述文本,作為當前的第一預測描述文本;基于當前的第一預測描述文本與當前的第二樣本描述文本之間的差異,對當前的描述生成模型的參數進行調整,得到新的描述生成模型;所述第一文本提示還用于指示:當前的描述生成模型生成符合第一指定描述風格的描述文本;一種描述風格用于指示描述文本的語種和或包含的語句的數目;在所述基于當前的第一預測描述文本與當前的第二樣本描述文本之間的差異,對當前的描述生成模型的參數進行調整,得到新的描述生成模型之后,所述方法還包括:利用所述第一文本提示以及當前的描述生成模型,對當前的每一第一樣本圖像進行處理,得到該第一樣本圖像中指定圖像區域的所述第一指定描述風格的描述文本,作為當前的第三樣本描述文本;將當前的第三樣本描述文本的描述風格從所述第一指定描述風格調整為第二指定描述風格,得到當前的第四樣本描述文本;從當前的第四樣本描述文本中,確定與對應的第一樣本圖像中指定圖像區域相匹配的描述文本,得到當前的第五樣本描述文本;將當前的每一第五樣本描述文本對應的第一樣本圖像和第三文本提示輸入當前的描述生成模型,得到該第一樣本圖像中指定圖像區域的所述第二指定描述風格的描述文本,作為當前的第三預測描述文本;基于當前的第三預測描述文本與當前的第五樣本描述文本之間的差異,對當前的描述生成模型的參數進行調整,得到新的描述生成模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州海康威視數字技術股份有限公司,其通訊地址為:310051 浙江省杭州市濱江區阡陌路555號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。