恭喜北京賓理信息科技有限公司李凱獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜北京賓理信息科技有限公司申請的專利用于目標任務的機器學習模型訓練方法、裝置及設備獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN115049077B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-05-20發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202210635268.7,技術領域涉及:G06N20/10;該發(fā)明授權用于目標任務的機器學習模型訓練方法、裝置及設備是由李凱;布如國設計研發(fā)完成,并于2022-06-06向國家知識產(chǎn)權局提交的專利申請。
本用于目標任務的機器學習模型訓練方法、裝置及設備在說明書摘要公布了:提供了一種用于目標任務的機器學習模型訓練方法、裝置及設備。該方法包括:獲取針對目標任務的樣本數(shù)據(jù)集;對樣本數(shù)據(jù)集中的每個樣本數(shù)據(jù),執(zhí)行包括下述各項的操作:針對該樣本數(shù)據(jù)的多個子樣本數(shù)據(jù)中的每個子樣本數(shù)據(jù),通過多個特征提取網(wǎng)絡中對應于該子樣本數(shù)據(jù)的模態(tài)的特征提取網(wǎng)絡從該子樣本數(shù)據(jù)中提取該子樣本數(shù)據(jù)的特征向量;基于該樣本數(shù)據(jù)的多個子樣本數(shù)據(jù)相應的特征向量,通過分類網(wǎng)絡獲取該樣本數(shù)據(jù)的分類結果;以及基于分類結果以及該樣本數(shù)據(jù)的目標任務類別標簽,調(diào)整分類網(wǎng)絡的參數(shù)以及多個特征提取網(wǎng)絡的參數(shù)。
本發(fā)明授權用于目標任務的機器學習模型訓練方法、裝置及設備在權利要求書中公布了:1.一種用于目標任務的機器學習模型訓練方法,包括:獲取針對所述目標任務的樣本數(shù)據(jù)集,其中,所述樣本數(shù)據(jù)集中的每個樣本數(shù)據(jù)包括多個子樣本數(shù)據(jù)以及該樣本數(shù)據(jù)對應的類別標簽,所述多個子樣本數(shù)據(jù)分別具有相應不同的多個模態(tài),所述多個子樣本數(shù)據(jù)包括人臉視覺數(shù)據(jù)、姿態(tài)視覺數(shù)據(jù)、語音數(shù)據(jù)、文本數(shù)據(jù)和生物信號數(shù)據(jù),并且,所述多個子樣本數(shù)據(jù)在時間和空間上對應,所述機器學習模型包括多個特征提取網(wǎng)絡和分類網(wǎng)絡,所述多個特征提取網(wǎng)絡分別對應于所述多個模態(tài),所述目標任務包括人員情緒識別、駕駛員駕駛狀態(tài)識別、人員健康狀態(tài)識別中的任一項,所述獲取針對所述目標任務的樣本數(shù)據(jù)集包括:獲取多個第一樣本數(shù)據(jù),其中,所述多個第一樣本數(shù)據(jù)中的每個第一樣本數(shù)據(jù)包括未標注的多個第一子樣本數(shù)據(jù),其中,所述多個第一子樣本數(shù)據(jù)分別具有所述多個模態(tài);對所述多個第一樣本數(shù)據(jù)中的每個第一樣本數(shù)據(jù),執(zhí)行包括下述各項的操作:針對該第一樣本數(shù)據(jù)中的所述多個第一子樣本數(shù)據(jù)中的每個第一子樣本數(shù)據(jù),通過與該第一子樣本數(shù)據(jù)的模態(tài)相對應的經(jīng)過預訓練的目標任務分類模型,獲取該第一子樣本數(shù)據(jù)的第一標注結果;以及將該第一樣本數(shù)據(jù)中的所述多個第一子樣本數(shù)據(jù)相應的第一標注結果進行統(tǒng)一,以得到該第一樣本數(shù)據(jù)對應的第一樣本標簽,其中,所述第一樣本標簽為多個預設標簽中的一個,所述多個第一子樣本數(shù)據(jù)相應的多個第一標注結果通過投票機制進行統(tǒng)一得到所述第一樣本標簽;以及基于所述多個第一樣本數(shù)據(jù)以及所述多個第一樣本數(shù)據(jù)分別對應的多個第一樣本標簽,生成所述樣本數(shù)據(jù)集,其中,所述多個第一樣本數(shù)據(jù)具有時間連續(xù)性并且按照時序排列,所述基于所述多個第一樣本數(shù)據(jù)以及所述多個第一樣本數(shù)據(jù)分別對應的多個第一樣本標簽,生成所述樣本數(shù)據(jù)集包括:基于預設滑動步長和預設時間滑動窗口,將所述多個第一樣本數(shù)據(jù)劃分為多個第一樣本數(shù)據(jù)子集;對所述多個第一樣本數(shù)據(jù)子集中的每個第一樣本數(shù)據(jù)子集,執(zhí)行包括下述各項的操作:基于該第一樣本數(shù)據(jù)子集中每個模態(tài)下的多個第一子樣本數(shù)據(jù),按照時序進行拼接,生成該第一樣本數(shù)據(jù)子集對應的、該模態(tài)下的第二子樣本數(shù)據(jù);以及基于該第一樣本數(shù)據(jù)子集中的多個第一樣本數(shù)據(jù)分別對應的多個第一樣本標簽,確定該第一樣本數(shù)據(jù)子集對應的第二樣本標簽,所述多個第一樣本標簽通過投票機制進行統(tǒng)一得到所述第二樣本標簽;以及基于所述多個第一樣本數(shù)據(jù)子集中的每個第一樣本數(shù)據(jù)子集對應的多個第二子樣本數(shù)據(jù)以及所述多個第一樣本數(shù)據(jù)子集分別對應的多個第二樣本標簽,生成所述樣本數(shù)據(jù)集,其中,所述第一樣本數(shù)據(jù)子集對應的多個第二子樣本數(shù)據(jù)對應于所述樣本數(shù)據(jù)中的多個子樣本數(shù)據(jù),所述第一樣本數(shù)據(jù)子集對應的第二樣本標簽對應于所述樣本數(shù)據(jù)的類別標簽;對所述樣本數(shù)據(jù)集中的每個樣本數(shù)據(jù),執(zhí)行包括下述各項的操作:針對該樣本數(shù)據(jù)的所述多個子樣本數(shù)據(jù)中的每個子樣本數(shù)據(jù),通過所述多個特征提取網(wǎng)絡中對應于該子樣本數(shù)據(jù)的模態(tài)的特征提取網(wǎng)絡從該子樣本數(shù)據(jù)中提取該子樣本數(shù)據(jù)的特征向量;基于該樣本數(shù)據(jù)的所述多個子樣本數(shù)據(jù)相應的特征向量,通過所述分類網(wǎng)絡獲取該樣本數(shù)據(jù)的分類結果;以及基于所述分類結果以及該樣本數(shù)據(jù)的目標任務類別標簽,調(diào)整所述分類網(wǎng)絡的參數(shù)以及所述多個特征提取網(wǎng)絡的參數(shù)。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人北京賓理信息科技有限公司,其通訊地址為:100020 北京市朝陽區(qū)工體東路18號2號樓二層B2180;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。