恭喜平一科技(杭州)有限公司鐘偉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜平一科技(杭州)有限公司申請的專利一種基于Transformer的視覺大模型訓練系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119169414B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411666890.X,技術領域涉及:G06V10/774;該發明授權一種基于Transformer的視覺大模型訓練系統是由鐘偉;侯文峰;張杭烽;王英軍;王魏強;朱錢華設計研發完成,并于2024-11-21向國家知識產權局提交的專利申請。
本一種基于Transformer的視覺大模型訓練系統在說明書摘要公布了:本發明涉及模型訓練技術領域,具體為一種基于Transformer的視覺大模型訓練系統,系統包括:模糊區域選擇模塊基于輸入圖像數據,獲取模糊區域和清晰區域的分布信息,根據圖像的模糊區域和清晰區域進行權重分配,獲取區域加權圖,將區域加權圖用于Transformer自注意力層中,生成權重調整后的注意力分布圖。本發明中,通過對圖像的亮度、顏色變化、對比度、邊緣清晰度和紋理密集度等特征信息進行處理,動態區分模糊和清晰區域,并賦予清晰區域更高權重,使模型更加聚焦高信息量的區域,提升了在細節豐富場景中的分辨能力。基于相似度偽標簽,通過標注樣本與無標簽樣本之間的特征相似性關系,提高了無標簽樣本在特征學習過程中的準確性和效率。
本發明授權一種基于Transformer的視覺大模型訓練系統在權利要求書中公布了:1.一種基于Transformer的視覺大模型訓練系統,其特征在于,所述系統包括:模糊區域選擇模塊基于輸入圖像數據,獲取模糊區域和清晰區域的分布信息,根據圖像的模糊區域和清晰區域進行權重分配,獲取區域加權圖,將區域加權圖用于Transformer自注意力層中,生成權重調整后的注意力分布圖;所述區域加權圖的獲取步驟具體為:基于輸入圖像數據,將圖像劃分為若干大小的區域塊,采用公式: 計算模糊程度得分,得到區域的模糊度評價值;其中,、是組合權重系數,用于調整亮度、顏色變化、對比度與邊緣清晰度、空間頻率的相對影響,是區域的亮度值,是亮度歸一化上限,即亮度的最大值,是顏色變化值,是顏色變化的歸一化上限,是對比度差異值,是對比度的歸一化上限,是邊緣清晰度,是邊緣清晰度的歸一化上限,是空間頻率,是空間頻率的歸一化上限,、、、、是特征權重系數;根據所述區域的模糊度評價值,對區域塊的模糊程度進行分析,并設定相應權重,通過將每個區域塊的權重數據填充至與區域大小相同的權重矩陣,將權重矩陣按區域在圖像中的位置拼接組合,得到區域加權圖;相似度偽標簽分配模塊參照所述權重調整后的注意力分布圖對圖像區域的權重,構建樣本間的相似度矩陣,為無標簽樣本分配偽標簽,并將無標簽樣本分配至最相似的標注樣本所屬的類別,得到偽標簽分配結果;協同特征關聯模塊基于所述區域加權圖中高權重區域的圖像局部細節區域,以及偽標簽分配結果中樣本間的相似度矩陣的信息,構建上下文關聯矩陣,動態調整局部特征和全局特征的權重,得到跨層次特征關聯圖;層級多尺度建模模塊基于所述跨層次特征關聯圖,對輸入圖像特征進行尺度劃分,通過跨層信息傳遞的方式,將小尺度區域特征嵌入大尺度區域實現特征的融合,將融合后的特征輸入至后續的Transformer層,生成多尺度特征訓練結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人平一科技(杭州)有限公司,其通訊地址為:311100 浙江省杭州市余杭區余杭街道中國人工智能小鎮8號樓503;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。