恭喜北京科杰科技有限公司高經郡獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京科杰科技有限公司申請的專利基于鍵列分區的HIVE分組運算性能優化與調度方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119597490B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510144047.3,技術領域涉及:G06F9/50;該發明授權基于鍵列分區的HIVE分組運算性能優化與調度方法是由高經郡;高海玲;呂彥奎設計研發完成,并于2025-02-10向國家知識產權局提交的專利申請。
本基于鍵列分區的HIVE分組運算性能優化與調度方法在說明書摘要公布了:本發明提供基于鍵列分區的HIVE分組運算性能優化與調度方法,涉及數據處理技術領域,包括通過構建鍵列分布直方圖,確定鍵列分區策略,對數據進行預處理;基于資源評估和動態規劃算法優化數據分區;采用最小生成樹算法計算最優數據傳輸路徑,并動態調整分配方案。本發明可提高HIVE分組運算性能,實現計算負載的動態平衡,有效解決數據傾斜問題,提升大規模數據處理效率。
本發明授權基于鍵列分區的HIVE分組運算性能優化與調度方法在權利要求書中公布了:1.基于鍵列分區的HIVE分組運算性能優化與調度方法,其特征在于,包括:接收用戶提交的HIVE計算任務,獲取所述HIVE計算任務中的數據表信息和分組運算鍵列信息,基于所述數據表信息和分組運算鍵列信息構建鍵列分布直方圖,根據所述鍵列分布直方圖計算鍵列數據的分布密度和數據傾斜度,基于所述鍵列數據的分布密度和數據傾斜度確定鍵列分區策略,所述鍵列分區策略包括數據分區大小、分區數量以及采樣率,按照所述鍵列分區策略對所述HIVE計算任務的數據進行分區預處理,生成初始數據分區集合;對所述初始數據分區集合中的每個數據分區執行資源評估,基于每個所述數據分區的數據量、計算復雜度和數據關聯度生成資源需求向量,將所述資源需求向量輸入預先訓練的負載預測模型,獲取每個所述數據分區的預測執行時間和資源占用率,根據所述預測執行時間和資源占用率構建數據分區的代價矩陣,基于所述代價矩陣采用動態規劃算法對所述初始數據分區集合進行優化重組,生成計算代價最優的目標數據分區集合;從預設的計算節點資源池中選擇滿足計算需求的多個計算節點構建分布式計算集群,基于所述目標數據分區集合中各數據分區的代價矩陣,采用最小生成樹算法計算所述多個計算節點之間的最優數據傳輸路徑,根據所述最優數據傳輸路徑將所述目標數據分區集合中的數據分區分配至對應的計算節點,在每個所述計算節點啟動分組運算子任務,實時監控各計算節點的負載狀態,當檢測到負載不均衡時,基于所述代價矩陣和所述最優數據傳輸路徑動態調整數據分區的分配方案,確保所述分布式計算集群的計算負載處于動態平衡狀態。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京科杰科技有限公司,其通訊地址為:100096 北京市海淀區東升科技園北街6號院10號樓11層101;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。