恭喜北京郵電大學孫利娟獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京郵電大學申請的專利視頻分類的方法、裝置、電子設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114037946B 。
龍圖騰網通過國家知識產權局官網在2025-05-27發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111556380.3,技術領域涉及:G06V20/40;該發明授權視頻分類的方法、裝置、電子設備及介質是由孫利娟;吳京宸;吳旭;頡夏青;李飛;張熙;楊金翠;邱莉榕;張勇東;方濱興設計研發完成,并于2021-12-17向國家知識產權局提交的專利申請。
本視頻分類的方法、裝置、電子設備及介質在說明書摘要公布了:本申請公開了一種視頻分類的方法、裝置、電子設備及介質。本申請中,可以獲取待分類視頻數據;將待分類視頻數據輸入至音視頻學習網絡,得到待分類視頻對應的圖像特征和音頻特征;以及待分類視頻對應的文本特征;將圖像特征、音頻特征以及文本特征輸入至融合學習網絡,得到融合特征向量;將融合特征向量輸入至Softmax分類器,并將分類器輸出的分類結果作為待分類視頻的分類結果。通過應用本申請的技術方案,可以在獲取待分類視頻之后,利用預設的學習網絡模型,得到該視頻數據的圖像特征、音頻特征以及文本特征,并將該三個特征進行融合后,根據融合的特征來判斷待分類視頻的分類結果。從而避免了相關技術中對視頻數據分類不準確的弊端。
本發明授權視頻分類的方法、裝置、電子設備及介質在權利要求書中公布了:1.一種視頻分類的方法,其特征在于,包括:獲取待分類視頻數據;將所述待分類視頻數據輸入至音視頻學習網絡,得到所述待分類視頻對應的圖像特征和音頻特征;以及,將所述待分類視頻數據輸入至文本學習網絡,得到所述待分類視頻對應的文本特征;將所述圖像特征、所述音頻特征以及所述文本特征輸入至融合學習網絡,得到融合特征向量;將所述融合特征向量輸入至Softmax分類器,并將所述分類器輸出的分類結果作為所述待分類視頻的分類結果;其中,所述將所述待分類視頻數據輸入至文本學習網絡,得到所述待分類視頻對應的文本特征,包括:對所述待分類視頻數據進行語音識別,得到待處理文本;利用預設轉換規則,將所述待處理文本中包含的字母字段以及表情字段轉換為文本字段;將包含所述文本字段的待處理文本轉換為one-hot向量;將所述one-hot向量輸入至所述文本學習網絡進行深度語義特征提取,得到所述文本特征;其中,建立表情和含義映射表,將所述待處理文本中包含的所述表情字段替換為標準文本;將字母及縮寫替換為輸入法相應結果中的第一個候選詞;所述將所述圖像特征、所述音頻特征以及所述文本特征輸入至融合學習網絡,得到融合特征向量,包括:分別對所述圖像特征、所述音頻特征以及所述文本特征進行向量轉換,得到圖像特征向量、音頻特征向量以及文本特征向量;對所述圖像特征向量、音頻特征向量以及文本特征向量進行向量相加,得到第一融合特征向量;以及,對所述圖像特征向量、音頻特征向量以及文本特征向量進行乘積歸一化,得到第二融合特征向量;基于所述第一融合特征向量以及所述第二融合特征向量,得到所述融合特征向量;其中,得到所述第二融合特征向量的方式為對所述圖像特征向量、所述音頻特征向量以及所述文本特征向量求Hadamard乘積。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京郵電大學,其通訊地址為:100876 北京市海淀區西土城路10號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。