湖北工業大學朱莉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖北工業大學申請的專利一種情感增益下特征互補的圖像情感分類方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119360143B 。
龍圖騰網通過國家知識產權局官網在2025-04-04發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411927485.9,技術領域涉及:G06V10/764;該發明授權一種情感增益下特征互補的圖像情感分類方法是由朱莉;李亞洲設計研發完成,并于2024-12-25向國家知識產權局提交的專利申請。
本一種情感增益下特征互補的圖像情感分類方法在說明書摘要公布了:本發明涉及計算機視覺技術領域,且公開了一種情感增益下特征互補的圖像情感分類方法,圖像預處理,將圖像數據集FI分為訓練集A1和測試集A2,將訓練集A1的圖像進行隨機縮放裁剪,最后得到448×448×3尺寸的圖像集合B;且圖像情感分類方法,通過為增強網絡對于圖像情感特征的挖掘能力,采用視覺注意力網絡作為主干網絡,并引入情感視覺注意力機制來提高模型對圖像中情感細微差別的敏感性,為獲取圖像中的顯著性特征和潛在性特征,一方面增強圖像的顯著性區域來獲得顯著性特征,另一方面抑制顯著性區域來挖掘圖像非顯著性區域中的潛在性特征,最后將顯著性特征和潛在性特征結合用于圖像情感分類。
本發明授權一種情感增益下特征互補的圖像情感分類方法在權利要求書中公布了:1.一種情感增益下特征互補的圖像情感分類方法,其特征在于,包括以下步驟:S1:圖像預處理,將圖像數據集FI分為訓練集A1和測試集A2,將訓練集A1的圖像進行隨機縮放裁剪,最后得到448×448×3尺寸的圖像集合B;S2:將448×448×3尺寸的圖像集合B劃分為16×16的圖像塊,通過vit網絡模型先提取到16×16圖像塊的上下文和全局信息特征,通過情感增益的方法得到情感增益特征Xtemo,將上下文和全局信息特征與情感增益特征Xtemo融合得到圖像特征X1;S3:對圖像特征X1通過CBR卷積塊得到顯著性特征XE和通過潛在性特征挖掘的方法得到潛在性特征XS,然后將顯著性特征接入到L個Transformer編碼塊,會獲得最終的顯著性特征XE1和L個潛在性特征,最后將這兩種特征以互補的形式挖掘圖像的情感特征,得到最終的情感特征XFIN;S4:將得到的情感特征XFIN輸入到一個多層感知機分類頭中,帶有標簽的圖像集合B對多層感知機分類頭進行訓練,將測試集A2的測試圖像經過固定尺寸放縮和中心裁剪的處理步驟后,輸入到訓練好的vit網絡模型中,得到對應的情感類別;S5:取圖像數據集Emotion6重復步驟S1-S4,得到對應的情感類別;所述步驟S2中的具體步驟為:S2.1:給定一個輸入圖像大小為448×448×3,將其分割成多個不重疊的圖像塊Pi,每個圖像塊的大小為16×16,設N為圖像塊的總數,每個圖像塊Pi表示為一個向量vecPi,對于每個圖像塊Pi,將其展平為一個維度為M的向量,為每個向量化的圖像塊vecPi添加位置嵌入Epos,i,再引入一個類別嵌入Ecls,最終得到16×16圖像的上下文以及全局信息特征XP,表達式為: 其中,vecPi為每個向量化的圖像塊,Epos,i為位置嵌入,Ecls為類別嵌入;S2.2.1:使用ResNet50網絡捕獲圖像集合B的空間特征Xres,表達式為: 其中,Bi為圖像集合B中其中一個圖像,尺寸為W×H×C,W為寬度,H為高度,C為通道數;S2.2.2:使用情感視覺注意力機制感知空間特征Xres的情感特征Xemo,表達式為: S2.2.3:使用包含一個1×1卷積、一個BN層和一個Relu激活函數的CBR卷積塊增強空間特征Xres,得到增強后的空間特征Xcbn1,表達式為: 其中,Xcbn1為增強后的空間特征,K為卷積核大小,Conv表示卷積操作,BN為批量歸一化操作,Relu為激活函數;S2.2.4:將情感特征Xemo與增強后的空間特征Xcbn1融合得到情感增益特征Xtemo,表達式為: S2.3:將上下文和全局信息特征與情感增益特征Xtemo融合得到圖像特征X1,表達式為: 。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖北工業大學,其通訊地址為:430070 湖北省武漢市洪山區南李路28號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。