国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預訂訂單
服務訂單
發布專利 發布成果 人才入駐 發布商標 發布需求

在線咨詢

聯系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 IP管家助手 需求市場 關于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜之江實驗室;上海人工智能創新中心胡永新獲國家專利權

恭喜之江實驗室;上海人工智能創新中心胡永新獲國家專利權

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

龍圖騰網恭喜之江實驗室;上海人工智能創新中心申請的專利基于分布式內存管理的大模型訓練故障恢復方法和裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119473732B

龍圖騰網通過國家知識產權局官網在2025-03-25發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510067262.8,技術領域涉及:G06F11/14;該發明授權基于分布式內存管理的大模型訓練故障恢復方法和裝置是由胡永新;程宏才;陳培俊;王琪;楊如丹;林志文設計研發完成,并于2025-01-16向國家知識產權局提交的專利申請。

基于分布式內存管理的大模型訓練故障恢復方法和裝置在說明書摘要公布了:本發明公開一種基于分布式內存管理的大模型訓練故障恢復方法,當判斷當前訓練輪次需要進行檢查點保存業務,獲取當前時刻模型狀態,并將獲取到的模型狀態序列化成可存儲的格式,生成檢查點數據;然后將檢查點數據從節點內設備端內存傳輸至主機端內存;并在傳輸完畢后繼續訓練任務,同時進行異步檢查點保存;異步檢查點保存包括數據分布式內存備份和數據持久化到磁盤兩種;訓練任務出錯時,通過檢查點數據進行任務恢復。本發明故障恢復時優先從內存中讀取備份數據,可以顯著減少因磁盤IO瓶頸導致的延遲,從而減少因保存或加載檢查點數據操作而導致的訓練暫停或效率下降,保持GPU或其他計算資源的高效利用,提高大規模模型訓練的連續性和穩定性。

本發明授權基于分布式內存管理的大模型訓練故障恢復方法和裝置在權利要求書中公布了:1.一種基于分布式內存管理的大模型訓練故障恢復方法,其特征在于,包括以下步驟:步驟S1:在集群大模型訓練過程中,判斷當前訓練輪次是否需要進行檢查點保存業務;若當前訓練輪次無需進行檢查點保存業務,則繼續訓練任務;若當前訓練輪次需要進行檢查點保存業務,則執行步驟S2~S5,觸發檢查點數據保存流程,完成數據備份;步驟S2:獲取當前時刻模型狀態,包括模型權重、優化器狀態以及訓練元數據;步驟S3:將獲取到的模型狀態序列化成可存儲的格式,生成檢查點數據;步驟S4:將檢查點數據從節點內設備端內存傳輸至主機端內存;步驟S5:判斷模型狀態序列化數據是否完全傳輸至主機端內存,若傳輸完畢,則繼續訓練任務并保存使用數據完整性校驗算法對檢查點數據生成的校驗值,同時進行異步檢查點保存;異步檢查點保存包括數據分布式內存備份和數據持久化到磁盤兩種;所述數據分布式內存備份具體包括:(1)篩選剩余內存大于m倍最大檢查點文件大小的節點,然后按照親和度AFFI高低進行排序,排序第一的節點為最優備份節點Bk,選擇前n個節點組成最優備份節點組合Bk_Group,其中n為單節點計算卡數量;(2)將本節點內存里的檢查點數據分別傳輸至最優備份節點Bk或最優備份節點組合Bk_Group內存中;(3)檢查點數據傳輸全部完成后,將內存備份完成標志位FIN_M置為TRUE;步驟S6:訓練任務出錯時,通過檢查點數據進行任務恢復。

如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人之江實驗室;上海人工智能創新中心,其通訊地址為:311121 浙江省杭州市余杭區中泰街道科創大道之江實驗室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
主站蜘蛛池模板: 黄梅县| 长春市| 榆中县| 丹阳市| 永靖县| 大渡口区| 龙泉市| 瑞丽市| 罗源县| 乌兰浩特市| 墨江| 湖州市| 彭水| 庆云县| 阜康市| 农安县| 尚志市| 百色市| 体育| 祁东县| 元谋县| 吉木乃县| 讷河市| 延庆县| 东辽县| 旅游| 黑山县| 云霄县| 泉州市| 延吉市| 诸暨市| 廊坊市| 南雄市| 苍梧县| 仪陇县| 揭西县| 临湘市| 东乌珠穆沁旗| 保德县| 图片| 马山县|