恭喜西安麥倉數據服務有限公司荊姝娟獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜西安麥倉數據服務有限公司申請的專利一種互聯網數據質量評估方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN113256135B 。
龍圖騰網通過國家知識產權局官網在2025-05-30發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202110615173.4,技術領域涉及:G06Q10/0639;該發明授權一種互聯網數據質量評估方法及系統是由荊姝娟;張貝貝設計研發完成,并于2021-06-02向國家知識產權局提交的專利申請。
本一種互聯網數據質量評估方法及系統在說明書摘要公布了:本發明涉及互聯網大數據領域,具體涉及一種互聯網數據質量評估方法及系統,結合概率論與數理統計專業知識,利用科學的統計推斷方法,通過設計合理的模擬數據與真實數據作比較,給出適用于大規模互聯網數據質量評估方法,可根據不同的數據、不同的業務需求做到動態可調整,實現完善的抽檢評估系統,便于互聯網數據質量管控人員高效快速的進行數據質量評估,質量評估系統易于操作使用及系統集成,從工程上提升互聯網數據質量評估的效率,進一步降低了互聯網數據質量評估工作的成本。
本發明授權一種互聯網數據質量評估方法及系統在權利要求書中公布了:1.一種互聯網數據質量評估方法,其特征在于,所述方法包括:S1定義互聯網數據集的準確率為;S2利用抽樣方式,在互聯網數據集中抽取數據樣本n,統計數據樣本準確率為;S3數據建模,推導互聯網數據集的準確率、數據樣本n與數據樣本準確率的可信程度關系;S31互聯網數據集的正確性服從Bernoulli分布,則互聯網數據集的準確率的期望為,方差為,標準差為;S32根據棣莫弗的中心極限定理可知,在相同的抽樣方式下,多次抽樣計算的數據樣本準確率服從正態分布,平均值,進一步地,多次抽樣計算的數據樣本準確率標準差的公式為;S33正態分布概率分布函數為,正態分布標準化處理函數,可變為標準的正態分布概率分布函數,,再通過變換函數可將抽樣檢查的數據樣本準確率分布轉換為標準的正態分布;S34定義互聯網數據集準確率差異為,取值范圍,即可接受的檢查準確率為到的閉區間,定義表示抽樣檢查結果落到可接受檢查準確率區間內的可信概率,推導出以下公式:;其中:表示從負無窮到上標準正態分布的累積函數,為互聯網數據集的準確率,為互聯網數據集準確率差異,n表示在互聯網數據集中抽取的數據樣本;S4量化評估與之間的差異,即數據樣本準確率可準確表示互聯網數據集的準確率;S5實驗驗證數據建模在互聯網數據質量評估問題上的有效性。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人西安麥倉數據服務有限公司,其通訊地址為:710006 陜西省西安市匯新路以東曲江國際金融中心1幢1單元12層11206號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。