恭喜華僑大學陳佳尤獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜華僑大學申請的專利基于時空信息的遮擋場景二維姿態估計的方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119625846B 。
龍圖騰網通過國家知識產權局官網在2025-06-03發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510169107.7,技術領域涉及:G06V40/20;該發明授權基于時空信息的遮擋場景二維姿態估計的方法及系統是由陳佳尤;張維緯;周亮太;林明都;鐘歡龍設計研發完成,并于2025-02-17向國家知識產權局提交的專利申請。
本基于時空信息的遮擋場景二維姿態估計的方法及系統在說明書摘要公布了:本發明公開了基于時空信息的遮擋場景二維姿態估計的方法及系統,涉及計算機視覺領域,方法包括:S1,獲取包括多個人體信息的視頻;S2,構建二維姿態估計模型;所述模型包括輸入模塊、可見性預測與屏蔽模塊、關鍵點推理模塊、時空依賴性模塊和回歸層;S3,將獲取的視頻輸入二維姿態估計模型進行訓練,獲得訓練好的二維姿態估計模型;S4,使用獲得訓練好的二維姿態估計模型進行基于時空信息的遮擋場景二維姿態估計。本發明構建出的二維姿態估計模型,能準確推理被遮擋的關鍵點,并提升姿態估計的平滑性和準確性,降低高頻噪聲的干擾,保證模型準確性的同時降低計算復雜度,以滿足實時性需求。
本發明授權基于時空信息的遮擋場景二維姿態估計的方法及系統在權利要求書中公布了:1.一種基于時空信息的遮擋場景二維姿態估計的方法,其特征在于,包括如下步驟:S1,獲取包括多個人體信息的視頻;S2,構建二維姿態估計模型;所述模型包括輸入模塊、可見性預測與屏蔽模塊、關鍵點推理模塊、時空依賴性模塊和回歸層;所述輸入模塊,識別并裁剪輸入的視頻中的個體,得到各個體的個體視頻片段,使用卷積骨干網絡依次提取各個體視頻片段的每一幀的關鍵點特征,逐個輸出至可見性預測與屏蔽模塊;所述可見性預測與屏蔽模塊,對輸入的關鍵點特征進行可見性預測,得到掩碼特征,并輸出至關鍵點推理模塊;所述關鍵點推理模塊,基于輸入的掩碼特征,補全被遮擋的關鍵點,獲得增強的關鍵點特征,并輸出至時空依賴性模塊;所述時空依賴性模塊,對輸入的增強的關鍵點特征進行逐幀處理,提取當前幀的每個關鍵點的時間依賴更新特征及每個關鍵點之間的空間依賴更新特征,并分別融合每個關鍵點的時間依賴更新特征和空間依賴更新特征獲得增強的時空特征,逐幀進行輸出;所述回歸層,基于逐幀處理增強的時空特征進行二維姿態估計,得到當前個體的二維姿態估計序列;逐個個體處理得到所有個體的二維姿態估計序列;S3,將獲取的視頻輸入二維姿態估計模型進行訓練,獲得訓練好的二維姿態估計模型;S4,使用獲得訓練好的二維姿態估計模型進行遮擋場景二維姿態估計;所述關鍵點推理模塊采用Transformer網絡;所述Transformer網絡由4個相同的Transformer塊按順序堆疊而成;每個所述Transformer塊包括一個多頭自關注模塊和一個多層感知模塊;所述Transformer網絡的處理步驟具體如下:首先,將掩碼特征輸入多頭自關注模塊;多頭自關注模塊的自注意頭表示為: 其中,表示自注意頭;softmax·表示softmax函數;WQ、WK和WV分別表示線性投影層;d表示每個掩碼特征的維度;表示的轉置;多頭自注意模塊組合了h個自注意頭,表示為: 其中,表示多頭自關注;表示第m個自注意頭;WP表示線性投影層;其次,進行殘差連接與層歸一化,公式如下: 其中,表示殘差連接與層歸一化的輸出結果;LayerNorm表示層歸一化操作;然后,輸入多層感知模塊,表示為: 其中,表示對輸入向量進行前饋神經網絡操作的結果;W1和W2分別表示線性變換矩陣;b1和b2分別表示偏置項;max0,·表示ReLU激活函數;最后,進行殘差連接與層歸一化,得到增強的關鍵點特征,公式如下: 其中,表示增強的關鍵點特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華僑大學,其通訊地址為:362000 福建省泉州市豐澤區城東城華北路269號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。