江西師范大學(xué)王端獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉江西師范大學(xué)申請的專利一種基于大語言模型的圖像描述文本生成方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119227816B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-04-18發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202411756885.8,技術(shù)領(lǐng)域涉及:G06N5/04;該發(fā)明授權(quán)一種基于大語言模型的圖像描述文本生成方法是由王端;彭超;陳宇峰;江愛文;魏智設(shè)計研發(fā)完成,并于2024-12-03向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于大語言模型的圖像描述文本生成方法在說明書摘要公布了:本發(fā)明公開了一種基于大語言模型的圖像描述文本生成方法,通過構(gòu)建圖像描述文本生成模型,獲取圖像的實體信息和實體關(guān)系場景圖;再將實體信息和實體關(guān)系場景圖導(dǎo)至大語言模型中,獲取圖像的初始描述進(jìn)一步潤色,獲取最終的潤色文本。本發(fā)明能精準(zhǔn)識別和描述圖像中的各個對象,還能清晰地表達(dá)它們之間的復(fù)雜交互關(guān)系。這種思維鏈?zhǔn)降拿枋錾煞绞剑粌H提高了模型生成描述的準(zhǔn)確性,還使得描述更符合人類的認(rèn)知習(xí)慣。通過逐步引導(dǎo),最終生成的描述能夠更好地傳達(dá)圖像的整體信息和意圖。
本發(fā)明授權(quán)一種基于大語言模型的圖像描述文本生成方法在權(quán)利要求書中公布了:1.一種基于大語言模型的圖像描述文本生成方法,其特征在于,包括以下步驟:步驟S1:獲取若干圖像和對應(yīng)的標(biāo)簽,并以此構(gòu)建記憶庫;步驟S2:構(gòu)建圖像描述文本生成模型,模型包括對象提取模塊和關(guān)系抽取模塊、初始描述文本生成模塊和文本潤色模塊;導(dǎo)入需要進(jìn)行文本描述的圖像I至對象提取模塊,基于步驟S1中的記憶庫獲取實體信息;步驟S3:導(dǎo)入步驟S2中需要進(jìn)行文本描述的圖像I和圖像的實體信息至關(guān)系抽取模塊,獲取對象關(guān)系場景圖;步驟S4:導(dǎo)入步驟S2中需要進(jìn)行文本描述的圖像I、步驟S2的實體信息和步驟S3的實體關(guān)系場景圖至初始描述文本生成模塊中,獲取初始描述;步驟S5:導(dǎo)入步驟S2中需要進(jìn)行文本描述的圖像I和導(dǎo)入步驟S4的圖像的初始描述文本至文本潤色模塊,獲取最終的潤色文本;步驟S3具體為:基于已識別的實體信息構(gòu)建相關(guān)提示輸入大語言模型,獲取需要進(jìn)行文本描述的圖像I中各個對象之間的交互關(guān)系;交互關(guān)系包括對象之間的相對位置、動作和狀態(tài);將對象和交互關(guān)系以圖結(jié)構(gòu)的形式進(jìn)行構(gòu)建,獲取場景圖,其中,圖結(jié)構(gòu)的節(jié)點代表對象,圖結(jié)構(gòu)的邊代表交互關(guān)系;其中,大語言模型設(shè)計的相關(guān)提示為: ;其中,表示交互關(guān)系條件相關(guān)提示,用于設(shè)置生成條件,表示實體信息,表示交互關(guān)系任務(wù)相關(guān)提示,用于設(shè)置生成要求;將圖像和相關(guān)提示輸入到大語言模型中,生成對象關(guān)系場景圖;表示為: ;其中為大語言模型,為視覺編碼器,為文本編碼器。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人江西師范大學(xué),其通訊地址為:330000 江西省南昌市高新技術(shù)開發(fā)區(qū)紫陽大道99號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 江蘇集萃微納自動化系統(tǒng)與裝備技術(shù)研究所有限公司王純配獲國家專利權(quán)
- 上海微創(chuàng)生命科技有限公司侯雙龍獲國家專利權(quán)
- 江蘇美的清潔電器股份有限公司林勇輝獲國家專利權(quán)
- 蘋果公司楊翔英獲國家專利權(quán)
- 武漢徠得智能技術(shù)有限公司裴根獲國家專利權(quán)
- 華為技術(shù)有限公司高翔獲國家專利權(quán)
- 深圳市上鼎家居用品有限公司莫銳獲國家專利權(quán)
- 郎靜明獲國家專利權(quán)
- 新疆金風(fēng)科技股份有限公司李向楠獲國家專利權(quán)
- 上海商米科技集團(tuán)股份有限公司余超獲國家專利權(quán)