恭喜北京奇虎科技有限公司張德岳獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京奇虎科技有限公司申請的專利模型安全評估方法、設備、存儲介質及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118445174B 。
龍圖騰網通過國家知識產權局官網在2025-04-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311117324.9,技術領域涉及:G06F11/3668;該發明授權模型安全評估方法、設備、存儲介質及裝置是由張德岳;楊東東;韓東;鄒權臣設計研發完成,并于2023-08-31向國家知識產權局提交的專利申請。
本模型安全評估方法、設備、存儲介質及裝置在說明書摘要公布了:本發明公開了一種模型安全評估方法、設備、存儲介質及裝置,本發明對待測試模型進行識別性能測試,獲得識別性能測試結果;基于預設白盒模型或預設黑盒模型對待測試模型進行魯棒性能測試,獲得魯棒性能測試結果;基于預設白盒模型或所述預設黑盒模型對待測試模型進行后門風險測試,獲得后門風險測試結果;根據性能測試結果、魯棒性能測試結果以及模型后門風險測試結果對待測試模型進行安全綜合分析,相較于現有技術中尚未建立統一深度學習模型安全性評估規范,測評維度單一導致針對模型安全性能評估方法的可用性、易用性以及均較差,本發明實現了多維度評估模型安全性能,可以全面保障模型的安全性能,提升模型安全性能。
本發明授權模型安全評估方法、設備、存儲介質及裝置在權利要求書中公布了:1.一種模型安全評估方法,其特征在于,所述模型安全評估方法包括以下步驟:對待測試模型進行識別性能測試,獲得識別性能測試結果;所述對待測試模型進行識別性能測試,獲得識別性能測試結果的步驟,包括:對預設初始測試集進行數據增強,構建泛化測試集;基于所述預設初始測試集對待測試模型進行識別性能測試,獲得第一ACC指標;基于所述泛化測試集對待測試模型進行識別性能測試,獲得第二ACC指標;根據所述第一ACC指標和所述第二ACC指標確定識別性能測試結果,其中,所述模型安全評估方法支持CV領域數據集的上傳與處理,所述預設初始測試集為用戶根據所述待測試模型的任務類型上傳的干凈測試集;所述泛化測試集包括調用圖像變換,構造一組經過翻轉、縮放的泛化測試集D1;調用像素變換,構造一組添加各種噪聲的泛化測試集D2;調用自然場景變換,構造一組添加自然噪聲的泛化測試集D3;調用風格遷移網絡,構造一組帶有藝術風格的泛化測試集D4;在模型識別性能的測評中,根據所述待測試模型在多組測試數據上的ACC表現作為評估指標,在各組測試數據上的ACC越高,說明模型對于正常數據和泛化數據的識別性能越好,所述待測試模型的識別性能的測評分數計算公式表述如下:Scoreacc=α0*ACCD0+α1*ACCD1+α2*ACCD2+α3*ACCD3+α4*ACCD4其中,Scoreacc表示所述待測試模型的識別性能評分,ACCD0表示所述待測試模型在預設初始測試集D0上的識別性能,ACCD1表示所述待測試模型在泛化測試集D1上的識別性能,ACCD2表示所述待測試模型在泛化測試集D2上的識別性能,ACCD3表示所述待測試模型在泛化測試集D3上的識別性能,ACCD4表示所述待測試模型在泛化測試集D4上的識別性能,α0、α1、α2、α3、α4、分別表示相應的權重系數;所述待測試模型安全性能的整體評分為:Score=w1*Scoreacc+w2*Scoreadv+w3*Scoreback;其中,Score為所述待測試模型安全性能的整體評分,Scoreadv表示所述待測試模型的魯棒性能評分,Scoreback表示所述待測試模型的后門風險評分,w1、w2、w3分別表示三項評分的權重系數,對抗攻擊風險是每個模型都會面臨的一種安全威脅,因此所述待測試模型的安全評分計算公式中權重系數w2的占比最大;基于預設白盒模型或預設黑盒模型對所述待測試模型進行魯棒性能測試,獲得魯棒性能測試結果;所述基于預設白盒模型或預設黑盒模型對所述待測試模型進行魯棒性能測試,獲得魯棒性能測試結果的步驟,包括:基于所述待測試模型的模擬訪問情況從預設白盒模型或預設黑盒模型中選取目標模型對所述待測試模型進行魯棒性能測試,獲得魯棒性能測試結果,所述模擬訪問情況包括完全獲取模型參數與輸出信息、獲取完整輸出信息但無法訪問模型參數以及獲取輸出類別信息但無法訪問模型參數;基于所述預設白盒模型或所述預設黑盒模型對所述待測試模型進行后門風險測試,獲得后門風險測試結果;所述基于所述預設白盒模型或所述預設黑盒模型對所述待測試模型進行后門風險測試,獲得后門風險測試結果的步驟,包括:獲取所述待測試模型的訪問狀態;在所述訪問狀態為僅獲取待檢測模型輸出層權重參數信息時,確定測試場景為白盒場景,并將所述預設白盒模型作為目標模型;根據所述預設白盒模型以及預設TPR模型評估方法對所述待測試模型進行后門風險測試,獲得后門風險測試結果;或,在所述訪問狀態為訪問待測試模型但僅獲取輸出類別信息時,確定測試場景為黑盒場景,并將所述預設黑盒模型作為目標模型;根據所述預設黑盒模型以及預設AEVA后門攻擊方法對所述待測試模型進行后門風險測試,獲得后門風險測試結果;根據所述性能測試結果、所述魯棒性能測試結果以及模型后門風險測試結果對所述待測試模型進行安全綜合分析。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京奇虎科技有限公司,其通訊地址為:100015 北京市朝陽區酒仙橋路6號院2號樓1至19層104號內8層801;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。