国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預訂訂單
服務訂單
發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標 發(fā)布需求

在線咨詢

聯(lián)系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 IP管家助手 需求市場 關于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜浙江大學陳珂獲國家專利權

恭喜浙江大學陳珂獲國家專利權

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!

龍圖騰網(wǎng)恭喜浙江大學申請的專利一種基于注意力特征信息的BERT模型融合方法獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN114580660B

龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-04-01發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202210176600.8,技術領域涉及:G06F18/25;該發(fā)明授權一種基于注意力特征信息的BERT模型融合方法是由陳珂;楊浩磊;壽黎但;胡天磊;陳剛;江大偉;駱歆遠設計研發(fā)完成,并于2022-02-25向國家知識產(chǎn)權局提交的專利申請。

一種基于注意力特征信息的BERT模型融合方法在說明書摘要公布了:本發(fā)明公開了一種基于注意力特征信息的BERT模型融合方法,該方法利用每個原模型對輸入文本的隱藏表示信息,來計算每個原模型的權重,然后利用每個原模型的權重信息,對原模型的注意力特征信息進行加權融合,最后利用融合后的注意力特征信息對新模型進行調(diào)整,提高新模型的表現(xiàn)效果。該方法可以充分利用BERT模型的注意力特征信息,提高融合后BERT模型的表現(xiàn)效果。相比于其他融合方法,本方法可以有效地完善融合后模型的注意力特征信息,使得融合后的模型對文本的注意力特征更加完整,進而提高融合后模型的表現(xiàn)效果。

本發(fā)明授權一種基于注意力特征信息的BERT模型融合方法在權利要求書中公布了:1.一種基于注意力特征信息的BERT模型融合方法,其特征在于,該方法的具體步驟如下:1首先,對于給定的多個原模型,構建出每個模型對于輸入文本的隱藏表示信息,用來表征對應模型對于輸入文本的編碼信息;2然后,利用每個原模型的隱藏表示信息與輸入文本的特征信息的差異,來計算每個模型的權重信息;3之后,利用每個原模型的權重信息,對模型內(nèi)部的注意力特征信息進行加權融合,生成融合后的注意力特征信息;4最后,利用融合后的注意力特征信息,來完成新模型的訓練,生成表現(xiàn)效果更好和泛化能力更強的新模型;步驟1給定的原模型為教師模型,用Ti表示;步驟4生成的新模型為學生模型,用S表示;Hx代表教師模型的隱藏層表示信息,Ax代表教師模型的注意力特征信息,Px代表教師模型的響應知識信息;所述步驟2中,利用教師模型隱式表示因子FT和學生模型輸出的隱藏層特征信息HS,來計算每個教師模型的權重信息;其輸入是每個教師模型隱式表示因子FT和學生模型最后一層Transformer輸出的隱藏層特征HS;其輸出是每個教師模型的權重信息WT;權重計算過程如下:首先通過計算教師模型隱式表示因子FT與學生模型隱藏層表示特征HS之間的均方差函數(shù)值,來獲取到每個教師模型對應的重要程度,其中均方差函數(shù)值越大,則對應的教師模型權重越小;之后再利用softmax函數(shù)對每個教師模型的重要程度進行歸一化,得到最終每個教師模型對應的權重信息WT;所述步驟3中,利用步驟2獲得的每個教師模型對應的權重信息WT來對教師模型的注意力特征信息進行融合,同時也對隱藏層特征信息和響應知識信息進行了融合;其輸入是教師模型最后一層Transformer輸出的注意力特征AT和隱藏層特征HT,教師模型輸出的響應知識PT,以及動態(tài)權重計算所得到的教師模型的權重信息WT;其輸出是融合后的注意力特征AM,融合后的隱藏層特征HM,以及融合后的響應知識PM;注意力融合的計算過程,主要是利用每個教師模型的權重信息,對不同教師的注意力特征進行加權平均;而隱藏層特征融合和響應知識融合的計算過程同樣是利用加權平均的方法來進行融合;所述步驟4中,利用融合后的教師模型知識來對學生模型進行訓練和調(diào)整;其輸入是融合后的教師模型知識AM,HM,PM和學生模型的輸出AS,HS,PS,其輸出是學生模型參數(shù)θ和教師模型隱式表示因子FT;學生模型訓練,主要是針對三類不同的知識計算損失函數(shù),并根據(jù)最終的損失函數(shù),來對學生模型參數(shù)和教師模型隱式表示因子進行調(diào)整;三類損失函數(shù)分別是注意力特征損失函數(shù)LossA,隱藏層特征損失函數(shù)LossH和響應知識損失函數(shù)LossP,其中注意力特征的損失函數(shù)采用KL散度來計算,隱藏層特征的損失函數(shù)采用均方差函數(shù)計算,響應知識的損失函數(shù)采用交叉熵來計算;之后利用這三類損失函數(shù)來計算最終的損失函數(shù)Loss,最終損失函數(shù)主要采用加權和的方式來計算;最后利用損失函數(shù)結果,來更新學生模型參數(shù)θ和隱式表示因子FT。

如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢嗳?a target="_blank" rel="noopener noreferrer nofollow" >浙江大學,其通訊地址為:310058 浙江省杭州市西湖區(qū)余杭塘路866號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

免責聲明
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。
主站蜘蛛池模板: 澳门| 柞水县| 东阳市| 武陟县| 岳西县| 定南县| 丘北县| 伊金霍洛旗| 平武县| 郸城县| 余庆县| 乌拉特后旗| 青川县| 绵竹市| 喀什市| 万全县| 海林市| 黄石市| 高要市| 黔江区| 宁南县| 武山县| 波密县| 贵南县| 泸水县| 贵德县| 札达县| 威信县| 门头沟区| 元氏县| 临夏市| 梓潼县| 安达市| 昌吉市| 岳阳县| 睢宁县| 石景山区| 自贡市| 上杭县| 北辰区| 深水埗区|