恭喜江西師范大學王端獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜江西師范大學申請的專利一種基于大語言模型的圖像描述文本生成方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119227816B 。
龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411756885.8,技術領域涉及:G06N5/04;該發明授權一種基于大語言模型的圖像描述文本生成方法是由王端;彭超;陳宇峰;江愛文;魏智設計研發完成,并于2024-12-03向國家知識產權局提交的專利申請。
本一種基于大語言模型的圖像描述文本生成方法在說明書摘要公布了:本發明公開了一種基于大語言模型的圖像描述文本生成方法,通過構建圖像描述文本生成模型,獲取圖像的實體信息和實體關系場景圖;再將實體信息和實體關系場景圖導至大語言模型中,獲取圖像的初始描述進一步潤色,獲取最終的潤色文本。本發明能精準識別和描述圖像中的各個對象,還能清晰地表達它們之間的復雜交互關系。這種思維鏈式的描述生成方式,不僅提高了模型生成描述的準確性,還使得描述更符合人類的認知習慣。通過逐步引導,最終生成的描述能夠更好地傳達圖像的整體信息和意圖。
本發明授權一種基于大語言模型的圖像描述文本生成方法在權利要求書中公布了:1.一種基于大語言模型的圖像描述文本生成方法,其特征在于,包括以下步驟:步驟S1:獲取若干圖像和對應的標簽,并以此構建記憶庫;步驟S2:構建圖像描述文本生成模型,模型包括對象提取模塊和關系抽取模塊、初始描述文本生成模塊和文本潤色模塊;導入需要進行文本描述的圖像I至對象提取模塊,基于步驟S1中的記憶庫獲取實體信息;步驟S3:導入步驟S2中需要進行文本描述的圖像I和圖像的實體信息至關系抽取模塊,獲取對象關系場景圖;步驟S4:導入步驟S2中需要進行文本描述的圖像I、步驟S2的實體信息和步驟S3的實體關系場景圖至初始描述文本生成模塊中,獲取初始描述;步驟S5:導入步驟S2中需要進行文本描述的圖像I和導入步驟S4的圖像的初始描述文本至文本潤色模塊,獲取最終的潤色文本;步驟S3具體為:基于已識別的實體信息構建相關提示輸入大語言模型,獲取需要進行文本描述的圖像I中各個對象之間的交互關系;交互關系包括對象之間的相對位置、動作和狀態;將對象和交互關系以圖結構的形式進行構建,獲取場景圖,其中,圖結構的節點代表對象,圖結構的邊代表交互關系;其中,大語言模型設計的相關提示為: ;其中,表示交互關系條件相關提示,用于設置生成條件,表示實體信息,表示交互關系任務相關提示,用于設置生成要求;將圖像和相關提示輸入到大語言模型中,生成對象關系場景圖;表示為: ;其中為大語言模型,為視覺編碼器,為文本編碼器。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人江西師范大學,其通訊地址為:330000 江西省南昌市高新技術開發區紫陽大道99號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。