恭喜寧夏大學劉立波獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜寧夏大學申請的專利基于指令引導GPT的文本檢索視頻方法、系統(tǒng)和設備獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN119166851B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-04-04發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202411294526.5,技術領域涉及:G06F16/735;該發(fā)明授權基于指令引導GPT的文本檢索視頻方法、系統(tǒng)和設備是由劉立波;習怡萌設計研發(fā)完成,并于2024-09-14向國家知識產(chǎn)權局提交的專利申請。
本基于指令引導GPT的文本檢索視頻方法、系統(tǒng)和設備在說明書摘要公布了:本發(fā)明公開了基于指令引導GPT的文本檢索視頻方法、系統(tǒng)和設備,涉及檢索技術領域,包括步驟:獲取多個視頻及其對應的多條描述性文本;將描述性文本輸入跨模態(tài)檢索模型中擴展文本,以及為視頻生成相應字幕;對字幕、擴展文本和描述性文本進行編碼,獲取編碼后的描述性文本編碼特征與字幕和擴展文本編碼的相似度,根據(jù)相似度結果獲取增強文本,將增強文本與偽配對視頻進行跨模態(tài)檢索模型的訓練,獲得最終的跨模態(tài)檢索模型,并進行檢索。本發(fā)明實現(xiàn)了將真實場景與描述性文本關聯(lián)起來,從而擴展文本中的實體信息,提高視頻文本之間的相關性,促使模型理解常識性信息,減少增強文本與視頻不匹配對檢索性能的影響,提高檢索效果。
本發(fā)明授權基于指令引導GPT的文本檢索視頻方法、系統(tǒng)和設備在權利要求書中公布了:1.一種基于指令引導GPT的文本檢索視頻方法,其特征在于,包括:獲取多個視頻及其對應的多條描述性文本;將所述描述性文本輸入跨模態(tài)檢索模型中,通過指令引導深度學習模型GPT對描述性文本擴展,獲得擴展文本,并為所述視頻生成相應的字幕;將擴展文本與對應的描述性文本拼接后進行編碼,獲得描述性文本編碼特征,并對所述字幕和視頻進行編碼,獲得字幕編碼特征和視頻編碼特征;獲取描述性文本編碼特征與視頻編碼特征間的相似度,并獲取描述性文本編碼特征與字幕編碼特征間的相似度;在所述描述性文本編碼特征與非匹配字幕的相似度高于匹配字幕時,將非匹配字幕作為偽配對字幕;將描述性文本編碼特征與偽配對字幕的共同描述作為增強文本,并通過增強文本與偽配對視頻對跨模態(tài)檢索模型進行訓練,獲得最終的跨模態(tài)檢索模型;將待檢索數(shù)據(jù)輸入最終的跨模態(tài)檢索模型中,通過輸出特征向量的余弦相似性排序獲得檢索結果;所述通過指令引導深度學習模型GPT對描述性文本擴展,獲得擴展文本,并為所述視頻生成相應的字幕,包括如下步驟:輸入一條手動設置指令,并使用該指令引導GPT對輸入文本進行擴展;具體表達式為:Ei~G·|Ti,I;其中,G·為GPT模型,Ti為第i個描述性文本,I為手動輸入指令,Ei為第i個描述性文本經(jīng)GPT模型擴展后的擴展文本;使用ZeroCap模型生成視頻的字幕,并將生成的字幕與擴展文本對齊;具體表達式為:Ci~Z·|Vi;其中,Z·代表視頻的字幕生成模型,Vi代表第i個視頻,Ci表示第i個視頻對應生成的字幕;將擴展文本與對應的描述性文本拼接后進行編碼,獲得描述性文本編碼特征,并對所述字幕和視頻進行編碼,獲得字幕編碼特征和視頻編碼特征,包括如下步驟:將所述擴展文本和對應描述性文本拼接后送入文本編碼器進行編碼,并獲取編碼后文本特征的平均值,將編碼后文本特征的平均值作為描述性文本編碼特征;具體表達式為: 其中,為第i個描述性文本編碼特征,Ti為第i個描述性文本,Tij為第i個描述性文本對應的第j個擴展文本,T·為CLIP文本編碼器,θ為CLIP文本編碼器對應的超參數(shù),N為擴展文本數(shù)量,為拼接;將所述字幕輸入文本編輯器中進行編碼,獲取編碼后字幕特征的平均值,將編碼后字幕特征的平均值作為字幕編碼;具體表達式為: 其中,為第i個視頻字幕編碼特征,為第i個視頻對應的第j個生成字幕,T·為CLIP文本編碼器,θ為其對應的超參數(shù),描述性文本編碼和視頻字幕編碼共用同一套超參數(shù);采用視覺編碼器對視頻進行編碼,在最后的輸出層取其第一個數(shù)據(jù)結構C1S_Token表示視頻編碼特征;具體表達式為: 其中,為第i個視頻編碼特征,F(xiàn)·為CLIP視頻編碼器,為其對應的超參數(shù),Vi為第i個視頻。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人寧夏大學,其通訊地址為:750021 寧夏回族自治區(qū)銀川市西夏區(qū)賀蘭山西路489號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。