恭喜浙江工業大學陳晉音獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜浙江工業大學申請的專利一種基于偏見神經元的數據去偏方法和裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115034371B 。
龍圖騰網通過國家知識產權局官網在2025-05-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210685939.0,技術領域涉及:G06N3/06;該發明授權一種基于偏見神經元的數據去偏方法和裝置是由陳晉音;陳一鳴;陳奕芃;鄭海斌;趙云波設計研發完成,并于2022-06-16向國家知識產權局提交的專利申請。
本一種基于偏見神經元的數據去偏方法和裝置在說明書摘要公布了:本發明公開了一種基于偏見神經元的數據去偏方法和裝置,首先獲取原始數據,并對所述原始數據中的類別屬性進行標記,得到標記后的數據集,記作數據集X;再翻轉數據集X中的敏感屬性構成數據集X′,利用數據集X和數據集X′篩選深度學習模型中的偏見神經元;構建反向數據集;取k的反向數據集中的樣本擴充至數據集X中合成增強數據集,隨后將增強數據集輸入至深度模型θ,并對深度模型θ進行訓練,直到深度模型θ的分類精度大于80%,完成去偏。本發明通過利用深度學習模型中的偏見神經元反向生成訓練樣本,將原始樣本數據集擴充增強,得到更加公平的數據集用于深度學習模型的訓練,從而達到消除偏見的目的,并且提升深度學習模型決策的公平性。
本發明授權一種基于偏見神經元的數據去偏方法和裝置在權利要求書中公布了:1.一種基于偏見神經元的數據去偏方法,其特征在于,包括以下步驟:1獲取原始數據,并對所述原始數據中的類別屬性進行標記,得到標記后的數據集,記作數據集X;所述原始數據為帶有敏感屬性的文本數據集;2翻轉數據集X中的敏感屬性構成數據集X′,利用數據集X和數據集X′篩選深度學習模型中的偏見神經元;所述步驟2具體包括以下子步驟:2.1翻轉數據集X中的敏感屬性構成數據集X′,使得數據集X′中的每個樣本的敏感屬性值與數據集X中對應樣本的敏感屬性值不同,但其他所有屬性值相同;所述數據集X為{x1,x2,...xi,...xN},數據集X′為{x1′,x2′,...xi′,...xN′},N表示數據集X中共有N個樣本,xi表示數據集X中的第i個樣本,i=1,2,...i,...N,xi和xi′之間敏感屬性相反但其他所有屬性值相同;將數據集X中的每個樣本xi和數據集X′中的每個樣本xi′組成樣本實例對xi,xi′,由所有樣本實例對構成新的數據集X*;2.2將數據集X*輸入到深度模型θ,所述深度模型θ為五層全連接模型;2.3測量深度模型θ中各個對應位置的神經元兩次的激活值,并對兩次激活值進行歸一化處理;隨后將歸一化處理后兩次激活值的絕對值差異大于0.3神經元篩選出來作為偏見神經元;3構建反向數據集;所述步驟3具體包括以下子步驟:3.1將步驟2.3篩選出來的偏見神經元在深度模型θ訓練中的損失函數記為loss;3.2在深度模型θ的輸出層,對輸入的數據xi進行求導,得到損失函數loss對數據xi的梯度,并且將該梯度乘上步長ε,加上數據xi,得到反向數據xi″;xi″的計算過程如下: 其中xi為數據集X中的第i個樣本,ε=0.001;3.3重復步驟4.3,直到深度模型θ的損失函數收斂,從而根據偏見神經元反向生成得到的新的反向數據集X″,所述反向數據集X″為{x1″,x2′′,...xi″,...xN′′};4取k的反向數據集中的樣本擴充至數據集X中合成增強數據集,隨后將增強數據集輸入至深度模型θ,并對深度模型θ進行訓練,直到深度模型θ的分類精度大于80%,完成去偏;所述深度模型θ為五層全連接模型,所述k的取值為30%~50%。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工業大學,其通訊地址為:310014 浙江省杭州市下城區潮王路18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。