恭喜大連理工大學陳圣倫獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜大連理工大學申請的專利一種聯合可見光相機和紅外相機的深度估計方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116563360B 。
龍圖騰網通過國家知識產權局官網在2025-05-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310197043.2,技術領域涉及:G06T7/50;該發明授權一種聯合可見光相機和紅外相機的深度估計方法是由陳圣倫;張宏;葉昕辰;王智慧;李豪杰設計研發完成,并于2023-03-03向國家知識產權局提交的專利申請。
本一種聯合可見光相機和紅外相機的深度估計方法在說明書摘要公布了:本發明屬于計算機視覺深度估計技術領域,提出一種聯合可見光相機和紅外相機的深度估計方法。以輕量級的CCF基本模塊、CRF基本模塊為基礎構建神經網絡VINet。CCF基本模塊加強了在特征編碼階段兩種模態特征之間的信息交流,CRF基本模塊探索各模態特征的特性,并在融合時選擇性的強調了更加相關的特征。兩者都具有輕量級與跨模態交叉的特點,因而適合部署到聯合可見光相機和紅外相機的深度估計中,在保證速度的同時也能達到很高的精度,為聯合可見光相機和紅外相機的深度估計任務提供了一種新的解決方案。
本發明授權一種聯合可見光相機和紅外相機的深度估計方法在權利要求書中公布了:1.一種聯合可見光相機和紅外相機的深度估計方法,其特征在于,基于CCF基本模塊和CRF基本模塊,提出一個深度估計網絡VINet用于聯合可見光相機和紅外相機的深度估計,具體包括步驟如下:步驟1、構建CCF基本模塊;CCF基本模塊包括通道洗牌ChannelShuffle操作模塊、拼接操作模塊和1×1卷積層;輸入特征為第i階段的同一尺度的可見光圖像特征圖fiV和紅外圖像特征圖fiI,設定二者大小為h×w×c的張量;首先使用通道洗牌ChannelShuffle操作,將兩種特征圖中每一個特征的c個通道進行重新組合形成新的特征;可見光圖像特征圖和紅外圖像特征圖二者的前個通道組成新的可見光特征,二者的后個通道組成新的紅外特征;新的可見光特征中各個通道的組合方式為新的紅外特征中各個通道的組合方式為然后,使用拼接操作沿著通道維度融合輸入特征和新的特征,分別得到大小為h×w×2c的融合特征;可見光圖像特征圖fiV與新的可見光特征拼接融合,紅外圖像特征圖fiI與新的紅外特征拼接融合;最后,使用1×1卷積層壓縮融合特征的通道數至c,輸出可見光特征和紅外特征分別為大小h×w×c的張量;步驟2構建CRF基本模塊;CRF基本模塊包括壓縮-激勵操作模塊、乘法操作模塊、相加操作、歸一化操作模塊和拼接操作;壓縮-激勵操作包括全局平池化層、全連接層和Sigmoid激活函數;輸入第i階段的經CCF基本模塊輸出的同一尺度的可見光特征和紅外特征首先使用壓縮-激勵操作模塊Squeeze-and-Excitation獲得可見光特征和紅外特征的全局統計,分別稱為可見光特征注意力向量和紅外特征注意力向量兩個注意力向量的大小為1×c;然后,使用注意力向量與其對應的特征執行乘法操作,獲得可見光模態內激活特征圖和紅外模態內激活特征圖兩個注意力向量執行相加操作,并使用Softmax函數沿著通道維度進行歸一化操作,獲得跨模態注意力向量跨模態注意力向量分別與可見光特征和紅外特征執行乘法操作,獲得可見光跨模態激活特征圖和紅外跨模態激活特征圖可見光模態內激活特征圖與可見光跨模態激活特征圖相加操作獲得可見光交叉模態激活特征圖紅外模態內激活特征圖與紅外跨模態激活特征圖相加操作獲得紅外交叉模態激活特征圖最后,利用拼接操作沿著通道維度融合可見光交叉模態激活特征圖和紅外交叉模態激活特征圖獲得拼接特征,使用一個1×1卷積層壓縮拼接特征的通道數至c,再使用步長為1的3×3的卷積層獲得最終的融合特征圖步驟3通過步驟1、步驟2構建起來的CCF基本模塊與CRF基本模塊搭建VINet網絡;整個VINet網絡分為編碼器和解碼器兩個部分,且可見光圖像和紅外圖像的編碼器結構相同;編碼器依次為卷積操作網絡層、三個Resnet網絡層;卷積操作包括步長為2的3×3的卷積層、步長為1的3×3的卷積層;每一層網絡層獲得的特征尺度依次為以及對特征尺度為以及的可見光特征和紅外特征分別執行CCF基本模塊后輸入至解碼器;解碼器包括4層網絡結構,用于逐步將可見光特征和紅外特征的分辨率恢復到其原始分辨率;輸入至解碼器的特征尺度的特征首先利用CRF基本模塊完成多模態的特征融合,然后使用反卷積層對完成多模態特征融合的融合特征圖進行2倍的上采樣獲得尺度的解碼特征;上采樣獲得的尺度的解碼特征與經CRF融合后的特征尺度沿著通道維度執行拼接操作,再通過一個1×1卷積層壓縮其通道數與特征尺度的特征通道數一致;重復上述操作,直到獲得特征尺度的解碼特征;特征尺度的解碼特征經過一個反卷積層獲得輸入分辨率的特征,該輸入分辨率的特征作為深度圖,用于最終的深度估計;步驟4根據步驟3獲得的特征圖,經過一個步長為1的3×3卷積層和ReLU激活函數獲得深度估計結果;采用平均絕對誤差構建損失函數對網絡進行訓練,損失為:其中V表示所有像素,Dp表示在像素位置p處的深度預測,表示像素位置p處的真實深度值。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人大連理工大學,其通訊地址為:116024 遼寧省大連市甘井子區凌工路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。