恭喜浙江工商大學張榮獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜浙江工商大學申請的專利基于擴散模型的虛擬模特服裝展示圖像智能生成方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119131212B 。
龍圖騰網通過國家知識產權局官網在2025-04-04發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411568331.5,技術領域涉及:G06T13/40;該發明授權基于擴散模型的虛擬模特服裝展示圖像智能生成方法及裝置是由張榮;王靜楠;王勛;左智文;董建鋒;金小剛設計研發完成,并于2024-11-05向國家知識產權局提交的專利申請。
本基于擴散模型的虛擬模特服裝展示圖像智能生成方法及裝置在說明書摘要公布了:本發明公開了一種基于擴散模型的虛擬模特服裝展示圖像智能生成方法及裝置。使用數據集中的原有數據與服裝分割模型處理得到目標服裝圖像和姿態圖像,并訓練得到服裝、姿態的重建變分自編碼器以及自適應姿態生成模型M1;對數據集內的原有數據進行空間拼接構建得到組合數據;用組合數據進行條件擴散模型的微調訓練,從特征融合、引導生成進行服裝增強,得到服裝增強的展示圖像生成模型M2;輸入素體人臺模特或任意人物身穿目標服裝的圖像,通過M1和M2得到初步的服裝展示圖像,使用人臉修復模型優化得到最終服裝展示圖像。本發明從訓練模式、服裝特征保留及生成結果方面實現創新,能夠實現操作便捷和高質量的虛擬模特服裝展示圖像生成。
本發明授權基于擴散模型的虛擬模特服裝展示圖像智能生成方法及裝置在權利要求書中公布了:1.一種基于擴散模型的虛擬模特服裝展示圖像智能生成方法,其特征在于:該方法包括以下步驟:1獲取{服裝圖像,模特服裝展示圖像}的成對數據集以及只包含模特服裝展示圖像的非成對數據集,并分割出模特服裝展示圖像的目標服裝圖像;同時進行姿態估計和文本描述提取,得到{文本描述,目標服裝圖像,姿態圖像}的數據對;2基于步驟1中的數據對訓練條件擴散模型,得到自適應姿態生成模型M1;3將模特服裝展示圖像中除服裝外的區域劃分為待生成區域,得到待生成圖像和待生成掩碼,將服裝圖像分別與待生成圖像、姿態圖像和模特服裝展示圖像在空間維度進行拼接,將待生成掩碼與初始化為0的同樣大小的掩碼拼接;4基于拼接后的圖像及掩碼訓練條件擴散模型,得到服裝增強的展示圖像生成模型M2,用于從特征融合、引導生成兩部分進行服裝細節增強;特征融合方法包括:使用特征空間連接,將數據D2與對應的服裝圖像或掩碼在空間維度上concat得到數據D3后,送入編碼器得到各個潛在表示,將所有潛在表示concat后作為U-Net網絡的輸入;使用注意力機制,將通過大規模文本圖像預訓練模型CLIP編碼得到的文本特征通過交叉注意力的方式注入模型以控制生成圖像的全局特征,同時將服裝作為額外的條件,在空間維度與其他條件結合,通過去噪U-Net中的自注意力機制,在圖像的任意兩個位置之間建立直接聯系,捕捉長距離的依賴關系,優化目標服裝與人體部分的交匯區域,進一步將提取的服裝紋理細節與人物圖像融合;引導生成方法包括:使用額外的無分類器引導CFG技術進行生成圖像的條件引導,CFG通過計算條件生成與非條件生成預測結果的殘差,并使用條件引導系數放大條件在生成過程中的影響,以此達到條件控制增強的效果,使用聯合文本條件及服裝條件的CFG來提高最終圖像的生成效果,具體公式如下:∈θzt,ct,cc=∈θzt+Sc*∈θzt,cc-∈θzt+St*∈θz,ct,cc-∈θzt,cc其中,∈θzt,ct表示文本條件ct引導預測的結果,∈θzt表示無文本條件引導預測的結果,St為文本條件引導系數,∈θzt,ct,cc表示文本條件ct與服裝條件cc聯合引導的預測結果,Sc為服裝條件引導系數;5獲取需要進行虛擬模特服裝展示的圖像,分割出目標服裝圖像;輸入到模型M1中,得到適應服裝的生成姿態圖像,將目標服裝圖像、生成姿態圖像共同輸入到模型M2中,得到初步的虛擬模特服裝展示圖像,并基于人臉修復模型得到優化后的最終虛擬模特服裝展示圖像。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工商大學,其通訊地址為:310012 浙江省杭州市西湖區教工路149號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。