恭喜數(shù)據(jù)堂(北京)科技股份有限公司齊紅威獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜數(shù)據(jù)堂(北京)科技股份有限公司申請的專利多模態(tài)大模型訓練數(shù)據(jù)采集方法及系統(tǒng)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN119380144B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-04-04發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202411946438.9,技術領域涉及:G06V10/774;該發(fā)明授權多模態(tài)大模型訓練數(shù)據(jù)采集方法及系統(tǒng)是由齊紅威;豐強澤;王大亮;高禹;鄭繼龍;史紅欣設計研發(fā)完成,并于2024-12-27向國家知識產(chǎn)權局提交的專利申請。
本多模態(tài)大模型訓練數(shù)據(jù)采集方法及系統(tǒng)在說明書摘要公布了:本申請涉及計算機技術領域,其具體地公開了一種多模態(tài)大模型訓練數(shù)據(jù)采集方法及系統(tǒng),其采用基于深度學習的數(shù)據(jù)處理技術對語義對齊的圖像數(shù)據(jù)和圖像內容文本描述數(shù)據(jù)進行語義特征提取和跨模態(tài)聯(lián)合編碼,以捕捉到模態(tài)間的語義關聯(lián),實現(xiàn)跨模態(tài)的語義信息融合,并在此基礎上進一步進行圖像樣本的生成,進而,通過對生成的圖像樣本與原始圖像數(shù)據(jù)進行語義偏移度量,以智能識別生成的圖像樣本是否為合格增強樣本。通過這種方式,可以有效地豐富多模態(tài)訓練數(shù)據(jù)集,確保數(shù)據(jù)的質量,解決多模態(tài)數(shù)據(jù)增強過程中跨模態(tài)語義一致性的問題,從而提高多模態(tài)大模型的訓練效率。
本發(fā)明授權多模態(tài)大模型訓練數(shù)據(jù)采集方法及系統(tǒng)在權利要求書中公布了:1.一種多模態(tài)大模型訓練數(shù)據(jù)采集方法,其特征在于,包括:獲取被標記為對齊的第一模態(tài)數(shù)據(jù)和第二模態(tài)數(shù)據(jù),其中,所述第一模態(tài)數(shù)據(jù)為圖像,所述第二模態(tài)數(shù)據(jù)為圖像內容文本描述;對所述第一模態(tài)數(shù)據(jù)和所述第二模態(tài)數(shù)據(jù)分別進行語義特征提取以得到圖像語義編碼特征圖和圖像內容文本描述語義編碼特征向量;對所述圖像語義編碼特征圖和所述圖像內容文本描述語義編碼特征向量進行跨模態(tài)聯(lián)合編碼以得到圖像-圖像文本描述跨模態(tài)提示引導聯(lián)合編碼特征圖;基于所述圖像-圖像文本描述跨模態(tài)提示引導聯(lián)合編碼特征圖進行圖像生成以得到生成圖像樣本;基于所述生成圖像樣本與所述第一模態(tài)數(shù)據(jù)之間的語義偏移,確定所述生成圖像樣本是否為合格增強樣本;其中,對所述圖像語義編碼特征圖和所述圖像內容文本描述語義編碼特征向量進行跨模態(tài)聯(lián)合編碼,包括:對所述圖像語義編碼特征圖和所述圖像內容文本描述語義編碼特征向量進行細粒度局部查詢編碼以得到圖像-圖像文本描述局部查詢提示語義編碼向量的集合;以所述圖像-圖像文本描述局部查詢提示語義編碼向量的集合作為提示信息,對所述圖像語義編碼特征圖進行細粒度特征調制以得到所述圖像-圖像文本描述跨模態(tài)提示引導聯(lián)合編碼特征圖。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人數(shù)據(jù)堂(北京)科技股份有限公司,其通訊地址為:100080 北京市海淀區(qū)寶盛南路1號院11號樓1層101-01;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。