恭喜北京航空航天大學崔燦獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京航空航天大學申請的專利基于隔離森林的跨項目缺陷預測樣本過濾方法及預測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114756461B 。
龍圖騰網通過國家知識產權局官網在2025-05-06發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210393192.1,技術領域涉及:G06F11/3604;該發明授權基于隔離森林的跨項目缺陷預測樣本過濾方法及預測方法是由崔燦;王世海;劉斌;路云峰設計研發完成,并于2022-04-14向國家知識產權局提交的專利申請。
本基于隔離森林的跨項目缺陷預測樣本過濾方法及預測方法在說明書摘要公布了:本發明公開了一種基于隔離森林的跨項目缺陷預測樣本過濾方法及預測方法,包括:提取跨項目軟件的缺陷數據集作為源項目數據集并進行數據預處理;采用SMOTE將預處理后的數據平衡化獲得平衡數據并劃分為正樣本數據和負樣本數據;構建加權隔離森林并進行樣本過濾;將所述過濾后的源數據集輸入機器學習算法分類器對所述分類器進行訓練,獲得缺陷預測模型并將被測軟件的目標數據集輸入所述缺陷預測模型,獲得所述目標數據集的預測結果并采用分類任務的性能評價指標對被測軟件進行性能評估;本發明解決了目前樣本過濾方法中強依賴于目標項目、效率低、預測模型性能差的問題,并且實現對軟件預測模型的數據選擇指導,進而縮短軟件開發的周期,節約成本。
本發明授權基于隔離森林的跨項目缺陷預測樣本過濾方法及預測方法在權利要求書中公布了:1.一種基于隔離森林的跨項目缺陷預測樣本過濾方法,其特征在于,包括:S1.提取同構跨項目軟件的數據集作為源項目數據集;S2.將所述源項目數據集進行平衡化獲得平衡數據;S3.將所述平衡數據劃分為正樣本數據和負樣本數據,所述正樣本數據為有缺陷的數據,所述負樣本為無缺陷的數據;S4.分別對所述正樣本數據和所述負樣本數據構建隔離森林;S5.對所述隔離森林進行加權處理并進行樣本過濾:計算每個樣本數據在隔離樹上的加權路徑長度,根據所述加權路徑長度計算每個樣本數據在加權隔離森林的平均加權路徑長度,根據所述平均加權路徑長度計算每個樣本數據的異常值,根據預設的異常比例移除加權隔離森林的異常樣本并將剩余的正樣本數據和負樣本數據合成,獲得過濾后的源數據集;S5的具體內容包括:S51.計算所述正樣本和所述負樣本在隔離樹iTree上的加權路徑長度hwx:其中,每層節點的加權邊計算為: 其中,φ1是當前節點真實樣本的數量,φ2為當前節點人工合成樣本的數量;hwx為每個樣本x在iTree上從根節點到一個外部節點遍歷終止時遍歷的加權邊的數量,即遍歷WiTree的總加權邊的數量: 其中,當h≤hlim時,h為WiTree的總高度,當h>hlim時,令h=hlim,cφ為調和參數; 其中,Hi是諧波數,可以估計為lni+0.5772156649歐拉常量;S52.計算所述正樣本和所述負樣本的平均加權路徑長度Ehwx,即樣本在所有WiTree上的平均加權邊的數量: 其中,t為WiForest中包含的WiTree的數量,i為第i棵加權隔離樹;S53.計算所述正樣本和所述負樣本標準化后的異常分數sx,并判斷樣本是否異常; 其中,Ehwx取值范圍為[0,1];S54.設置數據集中的異常比例為α,那么樣本集中異常分數為前的樣本為異常樣本,其中表示取整,將正樣本構成的森林和負樣本構成的森林分別移除異常分數在前α比例的樣本,剩余的正樣本和負樣本合成,構成過濾后的源數據集。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京航空航天大學,其通訊地址為:100191 北京市海淀區學院路37號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。