恭喜北京百度網訊科技有限公司戎康獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京百度網訊科技有限公司申請的專利圖文識別大模型的訓練方法、裝置、設備以及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117789221B 。
龍圖騰網通過國家知識產權局官網在2025-04-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311750629.3,技術領域涉及:G06V30/19;該發明授權圖文識別大模型的訓練方法、裝置、設備以及存儲介質是由戎康;宋雨鑫;張琦;劉芳龍設計研發完成,并于2023-12-19向國家知識產權局提交的專利申請。
本圖文識別大模型的訓練方法、裝置、設備以及存儲介質在說明書摘要公布了:本公開提供了一種圖文識別大模型的訓練方法、裝置、設備以及存儲介質,涉及人工智能技術領域,具體涉及計算機視覺、深度學習、大模型等技術領域,可應用于人工智能的內容生成等場景。該方法包括:獲取訓練樣本集,其中,訓練樣本集中的訓練樣本包括初始樣本圖片、初始樣本圖片對應的提示詞prompt以及初始樣本圖片對應的圖片描述信息;對初始樣本圖片進行縮放和分割,得到多張樣本圖片;將多張樣本圖片輸入至圖像處理轉換模塊,輸出得到初始樣本圖片對應的語義特征信息;將語義特征信息以及prompt作為輸入,將圖片描述信息作為輸出,對預先構建的大語言模型進行訓練,得到圖文識別大模型。
本發明授權圖文識別大模型的訓練方法、裝置、設備以及存儲介質在權利要求書中公布了:1.一種圖文識別大模型的訓練方法,包括:獲取訓練樣本集,其中,所述訓練樣本集中的訓練樣本包括初始樣本圖片、所述初始樣本圖片對應的提示詞prompt以及所述初始樣本圖片對應的圖片描述信息;對所述初始樣本圖片進行縮放和分割,得到多張樣本圖片;將所述多張樣本圖片輸入至圖像處理轉換模塊,輸出得到所述初始樣本圖片對應的語義特征信息;將所述語義特征信息、所述prompt、所述初始樣本圖片的人臉特征信息以及所述初始樣本圖片的人物名稱信息作為輸入,將所述圖片描述信息作為輸出,對預先構建的大語言模型進行訓練,得到所述圖文識別大模型,其中,所述人臉特征信息基于人臉特征提取模型得到,所述人物名稱信息根據所述人臉特征信息和預先構建的人臉特征庫得到。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京百度網訊科技有限公司,其通訊地址為:100085 北京市海淀區上地十街10號百度大廈2層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。