国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動(dòng)滑塊完成拼圖
個(gè)人中心

預(yù)訂訂單
服務(wù)訂單
發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標(biāo) 發(fā)布需求

在線咨詢

聯(lián)系我們

龍圖騰公眾號(hào)
首頁(yè) 專利交易 IP管家助手 科技果 科技人才 科技服務(wù) 國(guó)際服務(wù) 商標(biāo)交易 會(huì)員權(quán)益 需求市場(chǎng) 關(guān)于龍圖騰
 /  免費(fèi)注冊(cè)
到頂部 到底部
清空 搜索
  • 我要求購(gòu)
  • 我要出售
當(dāng)前位置 : 首頁(yè) > 專利喜報(bào) > 中國(guó)科學(xué)技術(shù)大學(xué)李誠(chéng)獲國(guó)家專利權(quán)

中國(guó)科學(xué)技術(shù)大學(xué)李誠(chéng)獲國(guó)家專利權(quán)

買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!

龍圖騰網(wǎng)獲悉中國(guó)科學(xué)技術(shù)大學(xué)申請(qǐng)的專利大語(yǔ)言模型推理優(yōu)化方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119323264B

龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-03-25發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411881594.1,技術(shù)領(lǐng)域涉及:G06N5/04;該發(fā)明授權(quán)大語(yǔ)言模型推理優(yōu)化方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)是由李誠(chéng);張駿呈;龔平;弋嘉煒設(shè)計(jì)研發(fā)完成,并于2024-12-19向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。

大語(yǔ)言模型推理優(yōu)化方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)在說明書摘要公布了:本發(fā)明公開了一種大語(yǔ)言模型推理優(yōu)化方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì),它們是相對(duì)應(yīng)的方案,方案中:在大語(yǔ)言模型推理過程中引入數(shù)據(jù)聚類與量化機(jī)制,當(dāng)KV緩存的大小超過預(yù)設(shè)閾值時(shí),首先將KV緩存數(shù)據(jù)進(jìn)行聚類劃分,再對(duì)部分?jǐn)?shù)據(jù)進(jìn)行低精度量化處理,另一部分則通過聚類中心代替,達(dá)到減少KV緩存大小的目的。通過本發(fā)明的方案,能夠顯著降低推理過程中的顯存占用,提高推理效率,并優(yōu)化系統(tǒng)資源的利用率。

本發(fā)明授權(quán)大語(yǔ)言模型推理優(yōu)化方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)在權(quán)利要求書中公布了:1.一種大語(yǔ)言模型推理優(yōu)化方法,其特征在于,包括:判斷大語(yǔ)言模型的KV緩存是否超過預(yù)設(shè)閾值;其中,KV緩存表示鍵值緩存;若超過預(yù)設(shè)閾值,則對(duì)KV緩存中的數(shù)據(jù)進(jìn)行聚類,獲得若干聚類類別;按照聚類類別對(duì)KV緩存中的數(shù)據(jù)進(jìn)行重排,即將屬于同一聚類類別的數(shù)據(jù)重新組織,使得同一聚類類別中的數(shù)據(jù)被安排在相鄰的位置,并且,對(duì)于每一聚類類別,分別計(jì)算其聚類中心的注意力得分,按照注意力得分,對(duì)聚類類別做降序排列;將一部分聚類類別中的數(shù)據(jù)按照數(shù)據(jù)類別進(jìn)行量化;將另一部分聚類類別中的數(shù)據(jù),使用所屬聚類類別的聚類中心替代;經(jīng)過量化與聚類中心替代處理后數(shù)據(jù)即為優(yōu)化的KV緩存數(shù)據(jù),利用優(yōu)化的KV緩存數(shù)據(jù)進(jìn)行大語(yǔ)言模型的后續(xù)推理。

如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中國(guó)科學(xué)技術(shù)大學(xué),其通訊地址為:230026 安徽省合肥市包河區(qū)金寨路96號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

免責(zé)聲明
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
主站蜘蛛池模板: 陕西省| 金秀| 察隅县| 济南市| 永和县| 霸州市| 祁东县| 四川省| 镶黄旗| 中江县| 辽宁省| 鄱阳县| 青河县| 蓬溪县| 青海省| 顺昌县| 剑川县| 双鸭山市| 乐业县| 肥乡县| 当涂县| 堆龙德庆县| 南川市| 罗平县| 姚安县| 兴安县| 汶川县| 扶绥县| 平远县| 绥江县| 郁南县| 黔西县| 荣昌县| 泉州市| 牡丹江市| 北安市| 怀远县| 南丰县| 盘锦市| 九台市| 彝良县|