恭喜中科方寸知微(南京)科技有限公司冷聰獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網恭喜中科方寸知微(南京)科技有限公司申請的專利基于可學習任務感知機制的視頻編解碼加速方法及系統獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN119031147B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202411518429.X,技術領域涉及:H04N19/593;該發(fā)明授權基于可學習任務感知機制的視頻編解碼加速方法及系統是由冷聰;夏錚錚;魏學備設計研發(fā)完成,并于2024-10-29向國家知識產權局提交的專利申請。
本基于可學習任務感知機制的視頻編解碼加速方法及系統在說明書摘要公布了:本發(fā)明公開了一種基于可學習任務感知機制的視頻編解碼加速方法及系統,該方法包括獲取原始視頻序列數據并預處理,計算得到最優(yōu)圖像組長度,構建圖像組結構數據;采用目標檢測模型,得到目標檢測結果;計算目標重要性得分;構建特征向量序列,得到有效性標記,生成優(yōu)化后的圖像組結構數據;輸入高分辨率編碼器和低分辨率編碼器,生成多尺度特征表示,形成量化數據包;使用動態(tài)空間選擇網絡生成空間重要性圖,處理得到保留的特征數據,生成編碼數據包;使用算術熵解碼器,得到量化特征數據,進行反量化,得到反量化特征圖;將其輸入級聯的低分辨率解碼器和高分辨率解碼器,生成最終視頻序列。本發(fā)明減少了資源和計算的浪費,提高了編解碼效率。
本發(fā)明授權基于可學習任務感知機制的視頻編解碼加速方法及系統在權利要求書中公布了:1.基于可學習任務感知機制的視頻編解碼加速方法,其特征在于,包括如下步驟:S1、從視頻源獲取原始視頻序列數據,并對其進行預處理,得到預處理后的視頻幀數據;基于預處理后的視頻幀數據,獲取預設數量的連續(xù)視頻幀數據,形成初始圖像組;基于初始圖像組,提取視頻幀特征;基于視頻幀特征,計算得到最優(yōu)圖像組長度;基于最優(yōu)圖像組長度和預處理后的視頻幀數據,構建最終的圖像組結構數據;S2、基于圖像組結構數據中的視頻幀,采用預訓練的目標檢測模型,得到每幀的目標檢測結果;基于目標檢測結果,計算每幀的目標重要性得分;基于圖像組結構數據中的相鄰幀,采用光流估計算法,得到幀間運動信息;基于目標重要性得分和幀間運動信息,構建特征向量序列;將特征向量序列輸入預訓練的圖像組選擇網絡,得到每幀的重要性預測值;根據預設的重要性閾值,對重要性預測值進行二值化處理,得到每幀的有效性標記;將有效性標記與圖像組結構數據結合,生成優(yōu)化后的圖像組結構數據;S3、將優(yōu)化后的圖像組結構數據并行輸入預訓練的高分辨率編碼器和低分辨率編碼器,得到高分辨率特征圖和低分辨率特征圖;對其分別采用自注意力機制,得到增強后的高分辨率特征圖和低分辨率特征圖;將增強后的高分辨率特征圖和低分辨率特征圖進行特征融合,得到多尺度特征表示;獲取當前量化參數,計算動態(tài)量化步長;使用動態(tài)量化步長對多尺度特征表示進行量化,得到離散化的特征數據;對離散化的特征數據應用熵編碼,得到初步壓縮的比特流;將初步壓縮的比特流和動態(tài)量化步長打包,形成量化數據包;S4、對量化數據包進行解析,得到量化特征值;使用預訓練的動態(tài)空間選擇網絡處理量化特征值,生成空間重要性圖;基于空間重要性圖和預設閾值,構建二值掩碼;基于二值掩碼,對量化特征值進行處理,得到保留的特征數據;將保留的特征數據轉換為一維序列,使用上下文自適應二進制算術編碼對一維序列進行熵編碼,生成壓縮比特流;基于二值掩碼和壓縮比特流,生成編碼數據包;S5、對編碼數據包進行解析,得到壓縮比特流和編碼元數據;使用算術熵解碼器對壓縮比特流進行解碼,得到量化特征數據和空間選擇掩碼;基于空間選擇掩碼,將量化特征數據重建為二維特征圖;使用編碼元數據中的量化參數,對二維特征圖進行反量化操作,得到反量化特征圖;將反量化特征圖輸入級聯的低分辨率解碼器和高分辨率解碼器,得到高、低解碼器的輸出;使用特征融合模塊將高、低解碼器的輸出進行合并,得到最終的重建視頻幀;基于重建視頻幀,采用去塊效應濾波器進行處理,得到優(yōu)化的重建視頻幀;基于優(yōu)化的重建視頻幀,生成最終視頻序列;步驟S1進一步為:S11、從預設的視頻輸入接口接收原始視頻數據流,將原始視頻數據流解析為單獨的原始視頻序列數據;基于原始視頻序列數據,采用高斯濾波算法進行降噪處理,得到降噪后的視頻幀數據;將降噪后的視頻幀數據從RGB色彩空間轉換到YUV色彩空間,得到色彩轉換后的視頻幀數據;根據預設的目標分辨率,對色彩轉換后的視頻幀數據進行雙線性插值重采樣,得到調整分辨率后的視頻幀數據;將調整分辨率后的視頻幀數據按時間順序存儲到幀緩沖器;S12、從幀緩沖器中讀取預設數量的連續(xù)視頻幀數據,對連續(xù)視頻幀數據進行幀間差分計算,得到幀間差異值序列;使用滑動窗口法對幀間差異值序列進行分析,計算局部峰值位置,得到場景切換候選點;S13、基于每個場景切換候選點的前后幀,采用邊緣檢測算法,計算邊緣分布的相似度,得到場景切換概率值;根據預設的場景切換閾值,篩選場景切換概率值,確定最終的場景切換點;以場景切換點為邊界,將連續(xù)視頻幀數據分割為預定個子序列;對每個子序列計算平均運動矢量幅度,得到運動復雜度指標;基于運動復雜度指標和預設的圖像組長度范圍,為每個子序列確定最適圖像組長度;S14、基于最適圖像組長度,將每個子序列分割為預定個圖像組;對每個圖像組指定第一幀為幀內編碼圖像幀,其余幀根據預設的編碼策略分配為前向預測編碼圖像幀或雙向預測內插幀,形成最終的圖像組結構數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中科方寸知微(南京)科技有限公司,其通訊地址為:211135 江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號人工智能產業(yè)園3號樓203B室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。