恭喜北京順詳科技有限公司劉曉華獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京順詳科技有限公司申請的專利大語言模型訓練方法、裝置、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118734975B 。
龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411039727.0,技術領域涉及:G06N5/04;該發明授權大語言模型訓練方法、裝置、設備及介質是由劉曉華;張程剴;劉澤恩;陳小梅設計研發完成,并于2024-07-31向國家知識產權局提交的專利申請。
本大語言模型訓練方法、裝置、設備及介質在說明書摘要公布了:本發明提供了大語言模型訓練方法、裝置、設備及介質。該方法包括針對大語言模型確定多個候選配置,每個候選配置凍結一個或多個層的參數并且具有不同的被凍結的層和或層數;基于相同的原始訓練參數,針對每個候選配置,使用多個訓練數據組中的一個訓練數據組進行訓練以獲得訓練組損失函數以及更新未凍結的層的參數,其中每個候選配置中被凍結的層保持原始訓練參數并且未被凍結的層的參數允許隨訓練發生變化;輸入另一個訓練數據組訓練大語言模型直至遍歷多個訓練數據組,基于訓練組損失函數確定訓練集損失函數;在遍歷多個訓練數據組后,使用測試數據集進行測試以獲得測試集損失函數;以及基于訓練集損失函數和測試集損失函數來確定目標配置。
本發明授權大語言模型訓練方法、裝置、設備及介質在權利要求書中公布了:1.一種用于醫療領域的大語言模型訓練方法,包括:獲取醫療文本數據,從所述醫療文本數據提取訓練數據集和測試數據集;針對待訓練的大語言模型確定多個候選配置,其中在所述多個候選配置中的每個候選配置中凍結所述待訓練的大語言模型的一個或多個層的參數并且所述每個候選配置各自具有不同的被凍結的層和或層數;基于相同的原始訓練參數,針對所述多個候選配置中的每個候選配置,使用訓練數據集包含的多個訓練數據組中的一個訓練數據組訓練所述待訓練的大語言模型以獲得訓練組損失函數以及更新所述待訓練的大語言模型中未凍結的層的參數,其中所述每個候選配置中被凍結的層保持原始訓練參數并且所述每個候選配置中未被凍結的層的參數允許隨訓練發生變化;在更新所述待訓練的大語言模型中未凍結的層的參數后,輸入所述多個訓練數據組中的另一個訓練數據組訓練所述待訓練的大語言模型直至遍歷所述多個訓練數據組,基于對應于所述多個訓練數據組的訓練組損失函數確定訓練集損失函數;在遍歷所述多個訓練數據組后,使用測試數據集測試所述待訓練的大語言模型以獲得測試集損失函數;針對與所述多個候選配置中的第一候選配置對應的第一訓練集損失函數和第一測試集損失函數,響應于第一訓練集損失函數和第一測試集損失函數之間的相關性大于第一預定閾值,并且響應于所述訓練集損失函數和所述測試集損失函數小于第二預定閾值,將所述第一候選配置確定為所述待訓練大語言模型的目標配置。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京順詳科技有限公司,其通訊地址為:100102 北京市朝陽區廣順北大街33號院1號樓5層1單元601室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。