恭喜杭州電子科技大學耿世杰獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜杭州電子科技大學申請的專利一種指令驅動的個性化時尚圖像編輯方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119693505B 。
龍圖騰網通過國家知識產權局官網在2025-05-30發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510211261.6,技術領域涉及:G06T11/60;該發明授權一種指令驅動的個性化時尚圖像編輯方法是由耿世杰;顧曉玲;朱靈達;吳圣琪設計研發完成,并于2025-02-25向國家知識產權局提交的專利申請。
本一種指令驅動的個性化時尚圖像編輯方法在說明書摘要公布了:本發明公開了一種指令驅動的個性化時尚圖像編輯方法。本發明:1、定義編輯任務的類別,針對不同的編輯任務,構建“原始圖像?參考圖像?目標圖像?文本編輯指令”四元數據組;2、構建目標語義網絡,生成遵循編輯指令和原始圖像的目標圖像語義信息,以此作為編輯模型的人體語義信息;3、構建統一編輯網絡,包括構建語義控制網絡、增加視覺聯合模塊以及應用低秩微調模塊,實現多項編輯任務使用相同的框架獲得對應的編輯能力;4、構建多任務低秩調整模塊,通過聯合訓練使框架具備將不同編輯指令對齊到不同編輯任務的能力。最終,實現不同任務間獨立又統一的框架。本發明在構建的特定數據集上進行了實驗,在定量和定性上都取得了很好的結果。
本發明授權一種指令驅動的個性化時尚圖像編輯方法在權利要求書中公布了:1.一種指令驅動的個性化時尚圖像編輯方法,其特征在于,包括如下步驟:步驟1、定義編輯任務的類別,針對不同的編輯任務,利用網絡爬蟲技術和現有的圖像生成技術構建“原始圖像-參考圖像-目標圖像-文本編輯指令”四元數據組;步驟2、構建并訓練目標語義網絡;使用文本編輯指令、參考圖像和原始圖像作為目標語義網絡輸入,提取目標圖像的語義信息作為訓練目標,得到遵循文本編輯指令的目標圖像語義信息,將目標圖像語義信息作為編輯模型的人體語義信息;步驟3、構建統一編輯網絡;在預訓練的指令驅動生成模型的基礎上增加三項變動;一、構建語義控制網絡,實現基于步驟2獲得的目標圖像語義信息的有效指導;二、增加視覺聯合模塊以在編輯結果中重建參考圖像;三、應用低秩微調模塊,通過少量訓練將編輯意圖的理解和實現對齊到低秩微調模塊;從而有效實現了多項編輯任務使用相同的框架獲得對應的編輯能力;低秩微調模塊通過為所有線性層和卷積層增加低秩的殘差網絡,其定義可抽象為如下公式:hx=W0x+λΔWx=W0x+λBAx,1其中,h表示任意線性層或卷積層的前向計算,x為該統一編輯網絡的輸入圖像;λ表示低秩微調模塊的權重;W0表示原始線性層或卷積層的權重,其維度為a×b;ΔW表示低秩微調模塊,由B·A構成,B和A是對應維度分別為a×r和r×b的線性層或卷積層,r是該低秩微調模塊的秩;步驟4、構建多任務低秩微調模塊;通過聯合訓練,使框架具備將不同文本編輯指令對齊到不同編輯任務的能力;最終,實現不同任務間獨立又統一的時尚編輯框架;所述多任務低秩微調模塊本質上是一個面向分類任務的MLP多層感知機,使用文本編輯指令T1對應的文本嵌入作為輸入,將文本嵌入的特征維度與任務數量的維度對齊,把多任務低秩微調模塊的輸出稱為低秩權重λ;將獨立編輯任務訓練得到的低秩微調模塊集合進行加權合并,并將映射得到的低秩權重λ作為對應任務的低秩微調模塊的激活程度;因此,公式1關于低秩微調模塊的抽象定義更新為如下公式: hx表示通過統一編輯網絡生成的輸出;W0表示初始的線性變化矩陣或權重矩陣,它應用于輸入圖像x;λi表示第i個低秩微調模塊的低秩權重,是低秩微調模塊SEL輸出的結果;ΔWi表示第i個低秩微調模塊的權重變化,即由低秩微調過程產生的偏差部分;Bi、Ai表示第i個低秩微調模塊的的矩陣分解部分;其中,低秩權重λ=[λ1,λ2,λ3,λ4],代表4組經過獨立訓練的低秩微調模塊。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市錢塘區白楊街道2號大街1158號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。