恭喜中國人民解放軍網絡空間部隊信息工程大學祝躍飛獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜中國人民解放軍網絡空間部隊信息工程大學申請的專利基于數據挖掘的報文類型識別方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114417857B 。
龍圖騰網通過國家知識產權局官網在2025-06-10發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111674303.8,技術領域涉及:G06F40/289;該發明授權基于數據挖掘的報文類型識別方法及裝置是由祝躍飛;楊資集;吳魏;林偉;費金龍;何宇博;劉龍;董成城設計研發完成,并于2021-12-31向國家知識產權局提交的專利申請。
本基于數據挖掘的報文類型識別方法及裝置在說明書摘要公布了:本發明屬于報文類型識別技術領域,特別涉及一種基于數據挖掘的報文類型識別方法及裝置,該方法包括首先對報文序列使用連續序列模式算法生成頻繁連續子序列;然后通過關鍵連續序列模式算法在選出的頻繁連續子序列上生成位置相關的候選關鍵字字段;其次基于因子圖模型計算候選關鍵字字段成為關鍵字的概率;最后選取概率最大的候選關鍵字字段作為關鍵字確定報文類型。本發明使用數據挖掘快速確定候選關鍵字字段,并改進了概率約束關系,能夠在耗時較短的情況下準確識別出關鍵字進而確定報文類型。
本發明授權基于數據挖掘的報文類型識別方法及裝置在權利要求書中公布了:1.一種基于數據挖掘的報文類型識別方法,其特征在于,包含以下步驟:步驟1、對報文序列使用連續序列模式算法生成頻繁連續子序列;所述連續序列模式算法具體包含以下步驟:首先從所有序列中提取長度為1個基本長度的子序列并將它們存儲在子序列集中;然后在長度為l–1個基本長度的子序列中計算達到最小支持度的頻繁連續子序列,其中支持度定義為包含目標子序列的序列數,并根據Apriori策略使用長度為l–1的頻繁連續子序列來生成長度為l的連續子序列,迭代執行此步驟直到不能提取新的連續子序列為止;最后取所有頻繁連續子序列的并集并將被集合內其它序列包含的子序列刪除,按支持度降序排序后返回;步驟2、通過關鍵連續序列模式算法在選出的頻繁連續子序列上生成位置相關的候選關鍵字字段,多個候選關鍵字字段組成候選關鍵字字段集合;所述通過關鍵連續序列模式算法在選出的頻繁連續子序列上生成位置相關的候選關鍵字字段,具體包括:首先在頻繁連續子序列集合中挑選滿足以下三個條件的子序列:1子序列位置標準差小于預設值,表明該子序列的位置變動范圍不大;2子序列的支持度不是1,表明該子序列沒有出現在所有的報文中;3子序列不存在一個已有的候選關鍵字字段中,防止重復計算;然后創建一組不包含滿足上述條件的子序列的報文序列集合并根據當前頻繁連續子序列的最小起始位置和最大結束位置截斷這些報文序列;最后在新創建的報文序列上運行連續序列模式算法,如果有獲取新的頻繁連續子序列則將連續序列模式算法得到的結果與當前頻繁連續子序列共同組成一個候選關鍵字字段集合并按照候選關鍵字字段結構進行信息保存;步驟3、基于因子圖模型計算候選關鍵字字段集合中的候選關鍵字字段成為關鍵字的概率;步驟4、選取概率最大的候選關鍵字字段作為關鍵字確定報文類型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國人民解放軍網絡空間部隊信息工程大學,其通訊地址為:450000 河南省鄭州市高新區科學大道62號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。