国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預訂訂單
服務訂單
發布專利 發布成果 人才入駐 發布商標 發布需求

在線咨詢

聯系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 IP管家助手 需求市場 關于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜浙江工業大學呂明琪獲國家專利權

恭喜浙江工業大學呂明琪獲國家專利權

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

龍圖騰網恭喜浙江工業大學申請的專利一種基于機器閱讀理解的威脅情報命名實體識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114757193B

龍圖騰網通過國家知識產權局官網在2025-05-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210375786.X,技術領域涉及:G06F40/295;該發明授權一種基于機器閱讀理解的威脅情報命名實體識別方法是由呂明琪;張煒鈺;朱添田;陳鐵明設計研發完成,并于2022-04-11向國家知識產權局提交的專利申請。

一種基于機器閱讀理解的威脅情報命名實體識別方法在說明書摘要公布了:本發明公開了一種基于機器閱讀理解的威脅情報命名實體識別方法,包括:對威脅情報進行分句處理,并基于網絡安全專業詞庫過濾不包含網絡安全專業詞匯的句子,過濾后得到句子集合;逐個取句子集合中的句子,對句子中的每個實體標注一個問答對;利用標注后的句子集合對識別模型進行訓練;利用訓練后的識別模型對威脅情報進行命名實體識別。本發明基于機器閱讀理解的威脅情報命名實體識別可以有效解決威脅情報實體分類模糊以及嵌套實體問題;構建的問題中自帶實體隱藏信息可以有效提高識別準確率;將實體識別由序列標注問題轉化為分類匹配問題,因此一個具有多個實體的句子可以生成多個訓練樣本,從而降低了對句子數量的要求。

本發明授權一種基于機器閱讀理解的威脅情報命名實體識別方法在權利要求書中公布了:1.一種基于機器閱讀理解的威脅情報命名實體識別方法,其特征在于,所述基于機器閱讀理解的威脅情報命名實體識別方法,包括:步驟1、對威脅情報進行分句處理,并基于網絡安全專業詞庫過濾不包含網絡安全專業詞匯的句子,過濾后得到句子集合;步驟2、逐個取句子集合中的句子,對句子中的每個實體標注一個問答對;步驟3、利用標注后的句子集合對識別模型進行訓練,包括:步驟3.1、取句子中的一類實體進行訓練,將實體標注的問答對中的問題和對應句子進行拼接,對拼接后的句子進行分詞處理得到詞序列,并基于詞序列進行特征提取得到文本特征矩陣;其中,所述基于詞序列進行特征提取得到文本特征矩陣,包括:在詞序列的頭部添加一個特殊標記用于表示序列的開始,在問題和句子之間添加標記分隔符,得到完整詞序列;利用ALBERT模型對完整詞序列進行特征提取得到文本特征矩陣,文本特征矩陣表示為E∈Rn*d,其中n為句子長度,d為ALBERT模型最后一層提取的特征的向量維度,即文本特征矩陣E的每一行代表一個詞對應的特征向量;步驟3.2、用兩個二分類器對文本特征矩陣中每個詞進行分類,第一個二分類器用于判斷詞是否為問題所對應的答案的開始詞,第二個二分類器用于判斷詞是否為問題所對應的答案的結束詞,得到句子中每個詞屬于開始詞的概率以及每個詞屬于結束詞的概率;步驟3.3、從句子中每個詞屬于開始詞的概率中選取概率為最大評分的詞對應的索引作為開始索引,從句子中每個詞屬于結束詞的概率中選取概率為最大評分的詞對應的索引作為結束索引;步驟3.4、根據開始索引和結束索引,使用一個二分類器計算開始詞和結束詞之間的匹配程度,輸出匹配程度高于閾值的開始索引和結束索引作為預測答案;步驟3.5、根據輸出的預測答案以及實際答案計算損失函數用于更新各二分類器的參數,并返回步驟3.1繼續進行識別模型訓練直至收斂;其中,所述根據輸出的預測答案以及實際答案計算損失函數,包括:在訓練階段有三個損失函數分別為:開始位置損失函數Lstart、結束位置損失函數Lend、實體匹配損失函數Lspan,最終識別模型的損失函數L為訓練各階段的損失總和,計算公式如下:Lstart=CEPstart,YstartLend=CEPend,YendLspan=CEPstart_end,Ystart_endL=αLstart+βLend+γLspan式中,Pstart為句子中每個詞屬于開始詞的預測概率,Ystart為句子中每個詞屬于實體的開始詞的實際概率,Pend為句子中每個詞屬于結束詞的預測概率,Yend為句子中每個詞屬于實體的結束詞的實際概率,Pstart_end表示開始詞和結束詞之間的預測匹配程度,Ystart_end表示開始詞和結束詞之間的實際匹配程度,CE為交叉熵損失函數,α,β,γ為權重系數,α,β,γ∈[0,1|;步驟4、利用訓練后的識別模型對威脅情報進行命名實體識別。

如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工業大學,其通訊地址為:310014 浙江省杭州市下城區潮王路18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
主站蜘蛛池模板: 吐鲁番市| 安福县| 彰化市| 威宁| 双流县| 宁武县| 天镇县| 凯里市| 昆山市| 通海县| 吉林市| 鄂托克前旗| 大庆市| 肃南| 蓝山县| 丹江口市| 乌兰县| 贡山| 西盟| 武山县| 双辽市| 柯坪县| 北碚区| 靖远县| 榆林市| 阿巴嘎旗| 铅山县| 全州县| 边坝县| 乌海市| 罗源县| 宜都市| 荥经县| 两当县| 河北区| 金堂县| 满洲里市| 海城市| 五寨县| 韩城市| 册亨县|