恭喜哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院);山東大學;北京三快在線科技有限公司;浙江大華技術股份有限公司;合肥工業大學聶禮強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院);山東大學;北京三快在線科技有限公司;浙江大華技術股份有限公司;合肥工業大學申請的專利一種第一視角視頻定位方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120032301B 。
龍圖騰網通過國家知識產權局官網在2025-07-04發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510510087.5,技術領域涉及:G06V20/40;該發明授權一種第一視角視頻定位方法及系統是由聶禮強;馮奕森;關惟俐;劉萌;夏華夏;朱樹磊;殷俊;汪萌設計研發完成,并于2025-04-23向國家知識產權局提交的專利申請。
本一種第一視角視頻定位方法及系統在說明書摘要公布了:本發明提供了一種第一視角視頻定位方法及系統,獲取第一視角視頻和查詢文本;使用預訓練的物品檢測器從第一視角視頻中提取物品注釋,并通過與查詢文本中的名詞匹配篩選出與查詢相關的物品類別;利用預訓練的特征編碼器編碼視頻、物品和文本信息,提取出視頻特征、物品特征與文本特征,進行文本特征上下文建模,并執行文本與物品間的特征交互;利用包含使用選擇性狀態空間的線性時間序列模型以及交叉注意力的多模態融合模塊進行視頻特征序列理解和特征融合,獲得多模態特征表示;使用所述多模態特征表示,進行第一視角視頻片段定位。本發明克服了現有技術中缺乏細粒度語義信息和難以理解第一視角視頻的缺陷。
本發明授權一種第一視角視頻定位方法及系統在權利要求書中公布了:1.一種第一視角視頻定位方法,其特征是,包括以下步驟: 獲取第一視角視頻和查詢文本; 使用預訓練的物品檢測器從第一視角視頻中提取物品注釋,并通過與查詢文本中的名詞匹配篩選出與查詢相關的物品類別; 利用預訓練的特征編碼器編碼視頻、物品和文本信息,提取出視頻特征、物品特征與文本特征,進行文本特征上下文建模,并執行文本與物品間的特征交互; 利用包含使用選擇性狀態空間的線性時間序列模型以及交叉注意力的多模態融合模塊進行視頻特征序列理解和特征融合,獲得多模態特征表示; 使用所述多模態特征表示,進行第一視角視頻片段定位; 其中,利用包含使用選擇性狀態空間的線性時間序列模型以及交叉注意力的多模態融合模塊進行視頻特征序列理解和特征融合的過程包括:使用雙向選擇性狀態空間的線性時間序列模型增強視頻特征,以捕捉視頻數據中的長距離依賴關系;應用交叉注意力機制和前饋層聚合增強后的視頻特征和查詢文本信息;使用并行交叉注意力機制聚合視頻特征和物品特征; 通過門控機制對兩種聚合不同信息的特征進行組合。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院);山東大學;北京三快在線科技有限公司;浙江大華技術股份有限公司;合肥工業大學,其通訊地址為:518055 廣東省深圳市南山區桃源街道深圳大學城哈爾濱工業大學校區;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。