恭喜中國科學院自動化研究所孫世穎獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜中國科學院自動化研究所申請的專利指代表達定位與分割模型的構建方法和裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114048284B 。
龍圖騰網通過國家知識產權局官網在2025-05-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111136455.2,技術領域涉及:G06F16/334;該發明授權指代表達定位與分割模型的構建方法和裝置是由孫世穎;李錢鐘;張宇佳;趙曉光;譚民設計研發完成,并于2021-09-27向國家知識產權局提交的專利申請。
本指代表達定位與分割模型的構建方法和裝置在說明書摘要公布了:本發明涉及指代表達定位與分割模型的構建方法和裝置,包括:構建預處理圖像主干網絡、預處理文本主干網絡、各個包含文本指導的視覺感知子網絡和視覺指導的文本感知子網絡的模態內在關系感知網絡,各交叉模態融合網絡、第一多尺度融合網絡和第二多尺度融合網絡,并利用指代表達定位與分割數據庫對上述網絡組合成的網絡進行訓練;本發明可以有效地進行圖像與文本特征的學習,通過在語義、位置空間上建立的兩模態的協同獲取多尺度下圖像?文本協同特征,并對多尺度下圖像?文本協同特征進行融合及特征選擇,進而使得模型能更準確、可靠地實現指代物的定位與分割。
本發明授權指代表達定位與分割模型的構建方法和裝置在權利要求書中公布了:1.一種指代表達定位與分割模型的構建方法,其特征在于,包括:步驟一:構建指代表達定位與分割數據庫;其中,所述數據庫的樣本包括:對指代物進行了定位和分割標注的圖像,以及描述指代物的文本;步驟二:構建預處理圖像主干網絡和預處理文本主干網絡;其中,所述預處理圖像主干網絡,用于特征提取得到圖像預處理特征,所述預處理文本主干網絡,用于特征提取得到文本預處理特征;所述圖像預處理特征為由不同尺度圖像特征組成的特征金字塔;步驟三:對于各尺度圖像特征,相應構建包含文本指導的視覺感知子網絡和視覺指導的文本感知子網絡的模態內在關系感知網絡;其中,所述文本指導的視覺感知子網絡,用于結合文本預處理特征,對相應尺度圖像特征進行學習,得到相應尺度下的圖像特征,所述視覺指導的文本感知子網絡,用于結合相應尺度圖像特征,對文本預處理特征進行學習,得到相應尺度下的文本特征;步驟四:構建與各模態內在關系感知網絡對應的各交叉模態融合網絡;其中,所述交叉模態融合網絡,用于考慮特征相似度,對相應尺度下的圖像特征和文本特征進行融合,得到相應尺度下圖像-文本協同特征;步驟五:構建第一多尺度融合網絡和第二多尺度融合網絡;其中,所述第一多尺度融合網絡和第二多尺度融合網絡,用于對各尺度下圖像-文本協同特征進行采樣、拼接、特征選擇和特征變換,得到目標特征;所述目標特征用于實現對指代物的定位和分割;步驟六:利用所述數據庫,對預處理圖像主干網絡、預處理文本主干網絡、各交叉模態融合網絡、各模態內在關系感知網絡、第一多尺度融合網絡和第二多尺度融合網絡組合成的網絡進行訓練,得到指代表達定位與分割模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國科學院自動化研究所,其通訊地址為:100190 北京市海淀區中關村東路95號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。