恭喜同濟大學趙才榮獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜同濟大學申請的專利一種上下文感知、噪聲魯棒的行人搜索方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114170625B 。
龍圖騰網通過國家知識產權局官網在2025-03-21發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111360243.2,技術領域涉及:G06V40/10;該發明授權一種上下文感知、噪聲魯棒的行人搜索方法是由趙才榮;陳至成設計研發完成,并于2021-11-17向國家知識產權局提交的專利申請。
本一種上下文感知、噪聲魯棒的行人搜索方法在說明書摘要公布了:本發明涉及計算機視覺領域,提出一種上下文感知、噪聲魯棒的行人搜索方法,采用深度學習框架,包括:1使用一個端到端的行人搜索神經網絡同時完成行人檢測和行人辨識;2在神經網絡的訓練過程中對行人特征的不確定性進行建模并額外使用同一場景行人的上下文信息約束行人的特征表示;3第一階段的訓練結束后,對于網絡預測的每一行人身份特征中心進行相似性比對,分析潛在的數據噪聲;4進行第二階段的訓練,在該階段的訓練過程中對于數據噪聲進行抑制;5使用訓練完畢的行人搜索網絡進行行人檢索任務并按照行人的相似程度對結果進行可視化。此算法具有充分利用場景圖像中的上下文信息,對于遮擋以及錯誤數據標注等來源的噪聲魯棒,相比現有的相關方法更加準確的特點。
本發明授權一種上下文感知、噪聲魯棒的行人搜索方法在權利要求書中公布了:1.一種上下文感知、噪聲魯棒的行人搜索方法,其特征在于,包括步驟:步驟1構建一個端到端的行人搜索神經網絡,該神經網絡使用完整的監控視頻畫面作為輸入,使用單個網絡同時完成行人的檢測以及行人的辨識兩項任務;步驟2進行神經網絡的訓練,本發明提出的神經網絡訓練過程分為兩個階段;首先進行第一階段神經網絡的訓練,在訓練過程中使用數據不確定性模塊對于數據中的不確定性進行建模,同時使用場景上下文信息對于網絡預測的行人特征表示進行約束;步驟3使用完成第一階段訓練的神經網絡對于訓練數據中的噪聲進行分析,查找訓練數據中可能存在噪聲;步驟4進行第二階段神經網絡的訓練,除了使用噪聲抑制模塊對于步驟3中噪聲進行抑制之外,該訓練階段的過程和其余各模塊的表現于第一階段訓練時保持一致;步驟5使用訓練完成的行人搜索神經網絡,進行場景圖像中行人的檢索任務;所述步驟2具體包括以下步驟:步驟2.1對圖像進行歸一化,將圖像減去預先計算的圖像均值,除以預先計算的圖像方差;步驟2.2將歸一化的圖像以及圖像上行人的邊界框進行縮放到指定尺寸,在保證寬高比不變;以一定的概率將圖像以及其標注水平翻轉;步驟2.3將步驟2.2處理完成的圖像送入骨干網絡,提取得到場景圖像的特征圖譜;步驟2.4將送入候選區域提取網絡,得到可能存在行人的候選區域;步驟2.5使用感興趣區域池化模塊,從提取候選區域的特征圖;步驟2.6將特征圖送入識別網絡,提取到表示候選區域特征的特征向量;步驟2.7將特征向量送入檢測子任務的分類和回歸模塊,分別得到后選區域的前景背景預測結果以及;步驟2.8將特征向量送入數據不確定性模塊,得到表示樣本特征的均值和標準差,從上述均值和標準差組成的高斯分布中進行采樣,得到用于訓練的行人特征表示;步驟2.9使用分類損失以及回歸損失計算RPN以及分類和回歸模塊的損失函數,使用在線實例匹配損失函數以及上下文對比損失函數計算行人特征表示的損失函數;所述上下文對比損失函數包括候選區域的上下文對比損失、人工標注區域的上下文對比損失函數;其中,候選區域的上下文對比損失表示為: 其中,表示被分配到第個人工標注區域對應的候選區域特征;表示人工標注區域的數量,表示第個人工標注區域對應的特征,表示矩陣的轉置,是用于該損失函數的放縮系數,是一個超參數;其中,人工標注區域的上下文對比損失函數表示為: 其中,是用于該損失函數的放縮系數、是一個超參數;其余的符號與候選區域的上下文對比損失函數相同;步驟2.10進行方向傳播運算,更新網絡的參數;步驟2.11按照事先定義好的迭代次數,重復步驟2.1~步驟2.10。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人同濟大學,其通訊地址為:200092 上海市楊浦區四平路1239號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。