恭喜浙江大學;杭州高新區(濱江)區塊鏈與數據安全研究院褚志軒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜浙江大學;杭州高新區(濱江)區塊鏈與數據安全研究院申請的專利一種基于擴散模型的文本增強圖像生成方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119379866B 。
龍圖騰網通過國家知識產權局官網在2025-04-04發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411961541.0,技術領域涉及:G06T11/60;該發明授權一種基于擴散模型的文本增強圖像生成方法是由褚志軒;孫浥塵;王渤軒;鄭昊倫;任奎設計研發完成,并于2024-12-30向國家知識產權局提交的專利申請。
本一種基于擴散模型的文本增強圖像生成方法在說明書摘要公布了:本發明公開了一種基于擴散模型的文本增強圖像生成方法,通過場景文本解析與關系建模機制,本框架通過深度整合大語言模型,顯著提升了文本理解能力,實現了對復雜場景關系的精確解析和語義理解,創新性地設計了物體提取、關系提取和物體定位等核心模塊,實現了對場景中物體位置、屬性等細節的精確把控、通過巧妙集成外部搜索引擎和專業的文本生成模塊,有效突破了傳統模型在圖像文字渲染和專有名詞物體生成方面的局限性,顯著提升了生成內容的準確性和真實性,通過整合知識圖譜,將物體關系表示為圖結構,并以入度最多的物體為核心錨點生成場景布局。本機制顯著提升了場景布局的語義一致性與視覺美觀性。
本發明授權一種基于擴散模型的文本增強圖像生成方法在權利要求書中公布了:1.一種基于擴散模型的文本增強圖像生成方法,其特征在于,包括:獲得提示詞文本;對提示詞文本中的物體單詞進行提取,輸出結構化形式的物體的名稱、數量、屬性特征信息;根據得到物體的名稱,將物體分類為一般物體類別、圖像中的文字內容類別、現實世界中存在的專有名詞物體類別,輸出分類后的物體清單;根據分類后的物體清單和提示詞文本,預測物體之間的空間關系和交互關系;基于物體之間的空間關系和交互關系,構建以三元組形式表示的物體關系結構;根據物體關系結構,構建完整的關系圖并分析圖結構,輸出場景中的核心錨點物體的位置及其在畫布中的基準位置;根據核心錨點物體的位置以及物體之間的空間關系,計算每個物體的具體邊界框參數,輸出所有物體的空間布局信息和尺寸比例,所述的邊界框參數包括坐標位置和尺寸大小;根據分類后的物體清單和所有物體的空間布局信息和尺寸比例,針對不同的物體類別采用相應的生成策略,輸出與提示詞文本相符的完整的圖像內容。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學;杭州高新區(濱江)區塊鏈與數據安全研究院,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。