国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預訂訂單
服務訂單
發布專利 發布成果 人才入駐 發布商標 發布需求

在線咨詢

聯系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 IP管家助手 需求市場 關于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜南京理工大學李俊獲國家專利權

恭喜南京理工大學李俊獲國家專利權

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

龍圖騰網恭喜南京理工大學申請的專利一種圖文融合的新物體AI生成方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119338947B

龍圖騰網通過國家知識產權局官網在2025-05-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411265710.7,技術領域涉及:G06T11/60;該發明授權一種圖文融合的新物體AI生成方法是由李俊;熊澤仁;楊健設計研發完成,并于2024-09-10向國家知識產權局提交的專利申請。

一種圖文融合的新物體AI生成方法在說明書摘要公布了:本發明公開了一種圖文融合的新物體AI生成方法,旨在結合物體文本與物體圖像生成不同的物體圖像;該方法的輸入是一個原始的物體圖像和一個要融合的物體文本名稱,輸出的是兩個物體平滑融合的新物體圖像,融合生成的物體不僅具有原始的物體圖像的布局或姿態,而且包含文本物體的特征信息。本發明可以立足于現實中存在的物體進行操作,從現實存在的物體出發進行融合,不局限于虛擬或合成的數據,而是可以從真實的物體圖像出發,該方法更加貼近現實世界,使得生成的圖像更具有真實感和實用性。

本發明授權一種圖文融合的新物體AI生成方法在權利要求書中公布了:1.一種圖文融合的新物體AI生成方法,其特征在于,根據原始物體圖像和物體文本,融合生成新物體圖像,該方法包括如下步驟:步驟1、輸入圖像文本編碼器ε·,物體圖像OI,物體文本OT,空文本ON,反演步數T,自注意力注入步長i,采樣噪聲∈t,預訓練的U-Net模型∈θ·,尺度因子α;步驟2、特征提取,利用編碼器ε·提取OI的隱含特征z0=εOI,空文本ON的文本編碼τN=εON,以及物體文本OT的文本編碼τ=εOT;步驟3、通過公式:對進行反演得到其中表示反演得到的最終第t步的噪聲隱含特征,是采樣器定義的第t步方差;步驟4、進行保真度與可編輯性的平衡,以作為噪聲隱含特征的起始點,通過公式 進行去噪,在去噪過程中使用l2范數損失優化∈t+1使得逼近反演過程中的提高保真性,并使用KL散度損失來衡量∈t+1與高斯分布的距離,同時處理保真度和可編輯性,得到最終優化后的序列其中t∈{0,…,T};是一個預訓練的U網絡結構,其中包含自注意力模塊,是在∈θ·中從派生的問詢、鍵、價值特征向量,d是價值特征向量的維度;步驟5、定義融合去噪過程,以作為噪聲隱含特征的起始,通過公式進行去噪得到融合圖像Oα,i,其中α是縮放交叉注意力層的尺度因子,i是自注意力注入步數;步驟6、∈θzt,t,τ,α,i是一個預訓練的U網絡結構,其中包含注入自注意力層和尺度交叉注意力層;引入自注意力注入步數i,0≤i≤T,注入自注意力層定義為其中 其中是在∈θ·中從zt派生的查詢和鍵特征向量,d是價值向量的維度,是正常去噪過程中的自注意力圖;引入一個尺度因子α∈[0,2]控制融合過程,尺度交叉注意力層定義為其中是問詢特征,是文本編碼τ=εOT派生的查詢和鍵特征向量,d是價值向量的維度;步驟7、定義相似性距離計算如下:圖像OI與步驟5融合生成圖像Oα,i之間的相似度表示為Isimα,i=dOI,Oα,i;文本OT與步驟5融合生成圖像Oα,i之間的相似度表示為Tsimα,i=dOT,Oα,i,其中d·,·為圖像文本的相似性距離函數;步驟8、使用步驟7定義,當α=1,Isimi=dOI,Oα=1,i;自適應調整步驟6注入自注意力的注入步數:初始化i更新方法如下, 其中與是根據觀察設置的軟閾值;更新后得到i=i*;步驟9、根據步驟8得到的i=i*,使用步驟7定義,進而簡化為,Isimα=dOI,Oα,i=i*和Tsimα=dOT,Oα,i=i*,其中d·,·表示文本圖像與圖像之間的相似距離;定義融合得分函數Fα如下: 其中β為權重因子,參數k是為了緩解由于文本和圖像模態差異導致的高Isimα和低Tsimα之間的尺度不一致,從而確保它們的尺度平衡;步驟10、通過步驟9定義的融合得分函數作為目標函數,基于步驟5定義的融合去噪過程使用黃金分割搜索法來確定α的最優值α=α*;步驟11、通過步驟8、10找到最優的i*與α*,輸入文生圖模型生成融合最優的視覺圖像Oα*,i*。

如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京理工大學,其通訊地址為:210094 江蘇省南京市孝陵衛200號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
主站蜘蛛池模板: 老河口市| 沛县| 溆浦县| 东辽县| 禄丰县| 乌海市| 霍林郭勒市| 霍山县| 建湖县| 肇源县| 宜昌市| 当雄县| 吉安市| 平阳县| 黄山市| 南阳市| 西城区| 广元市| 大宁县| 监利县| 奎屯市| 偃师市| 青海省| 珲春市| 灌云县| 化隆| 巴南区| 讷河市| 华亭县| 青龙| 辰溪县| 鲜城| 石泉县| 泸定县| 喀什市| 光山县| 宜黄县| 寿阳县| 卓尼县| 东莞市| 临泉县|