恭喜哈爾濱工業大學(威海)田一民獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜哈爾濱工業大學(威海)申請的專利面向跨領域多任務的大模型適配器高效部署方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119179495B 。
龍圖騰網通過國家知識產權局官網在2025-03-25發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411191319.7,技術領域涉及:G06F8/60;該發明授權面向跨領域多任務的大模型適配器高效部署方法及系統是由田一民;張柏林;隋典伯;涂志瑩;初佃輝設計研發完成,并于2024-08-28向國家知識產權局提交的專利申請。
本面向跨領域多任務的大模型適配器高效部署方法及系統在說明書摘要公布了:本發明公開了一種面向跨領域多任務的大模型適配器高效部署方法及系統,所述方法包括如下步驟:步驟S1、構造模型adapter索引;步驟S2、構造用于訓練selector的混合表征數據集;步驟S3、訓練selector;步驟S4、基于selector的適配器聯合部署。本發明提出了大語言模型部署中適配器選擇器selector這一概念,可以根據模型的輸入精準判斷輸入對應的領域和任務,從而引導系統精準將大模型與這一領域與任務的模型適配器精準匹配并重組,提高了多任務推理的準確度;同時提出了selector的訓練方法和攜帶selector的大模型的推理流程和部署方法,提高了有限資源的資源利用率。
本發明授權面向跨領域多任務的大模型適配器高效部署方法及系統在權利要求書中公布了:1.一種面向跨領域多任務的大模型適配器高效部署方法,其特征在于所述方法包括如下步驟:步驟S1、構造模型adapter索引:步驟S11、選取基于待部署的多領域多任務的文本訓練指令數據集,對于每個文本訓練指令數據集,分別與對應的指令微調prompt相匹配,然后在一個相同的基礎大語言模型上使用lora微調方法進行指令微調訓練,得到每個文本訓練指令數據集對應的adapter權重并保存;步驟S12、基于領域和任務構造二維數據索引表,該索引表以領域-任務為鍵,以adapter的文件路徑為值,以領域-任務為索引搜索到對應的adapter,得到adapter索引、待部署領域列表、待部署任務列表;步驟S2、構造用于訓練selector的混合表征數據集:對于每個文本訓練指令數據集,將每條數據通過基礎模型的embedding層結構得到含有語義特征的低維嵌入向量,使用Kmeans聚類算法對嵌入向量集進行數據篩選,將聚類的簇中心的集合作為這個文本訓練指令數據集的代表性表征數據集,將不同文本訓練指令數據集的表征數據集無序混合,得到selector訓練集;步驟S3、訓練selector:步驟S31、將步驟S2得到的selector訓練集的每條數據、步驟S1得到的待部署領域列表與待部署任務列表一起與通用selector訓練prompt相匹配,得到含有prompt的最終訓練集;步驟S32、使用步驟S31得到的數據集在步驟S1中的基礎大語言模型上使用lora微調方法進行指令微調訓練,得到selector權重并保存;步驟S4、基于selector的適配器聯合部署:步驟S41、部署策略:根據計算資源決定部署的基礎大語言模型的數量、selector的位置與數量、adapter的位置;步驟S42、模型加載:應用部署策略得到部署參數配置、適配器配置文件,將基礎大語言模型、selector、adapters分別載入顯存資源的合適對應位置,將步驟S1得到的adapter索引、待部署領域列表、待部署任務列表分別載入內存資源的合適位置;步驟S43、Adapter注冊:將selector與adapters注冊到基礎大語言模型中,通過adapters索引建立聯系,每一個adapter與對應adapters索引中的adapter_name相匹配,adapter_name的內容與adapter對應的領域和任務相關;步驟S44、模型生成:問題數據與selector的prompt相匹配后進入加載selector的模型,輸出問題相關的領域和任務;根據相關的領域和任務在adapters索引中查找對應的adapter;將加載selector的模型與selector解耦并與對應adapter重組;問題數據與領域任務的prompt相匹配后進入加載adapter的模型,輸出即為問題的答案;步驟S45、將步驟S44的模型生成過程暴露為API接口,即完成部署,供用戶方便調用。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人哈爾濱工業大學(威海),其通訊地址為:264209 山東省威海市環翠區文化西路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。