您的位置:
首页
>
中文期刊论文
>
详情页
异构Spark集群数据倾斜修正调度策略
- 作 者:
-
卞琛;
修位蓉;
于炯;
- 作者机构:
-
广东金融学院互联网金融与信息工程学院;
新疆大学信息科学与工程学院;
广州商学院信息技术与工程学院;
- 关键词:
-
异构集群;
数据倾斜;
并行调度;
数据分配;
Spark;
- 期刊名称:
- 计算机工程与科学
- i s s n:
- 1007-130X
- 年卷期:
-
2022 年
44 卷
004 期
- 页 码:
- 620-630
- 摘 要:
-
异构Spark集群存在木桶效应,不合理的并行度导致任务分配与工作节点计算能力的适配性较差,进而影响集群计算效率和资源利用率.针对这一问题,首先建立模型,分析数据分布、并行度参数和节点任务分配的耦合关系,提出算法的优化目标,设计异构Spark集群的数据倾斜修正调度策略DSCS,包括并行度预估算法、数据倾斜修正算法和异构节点任务分配算法.预估算法对并行度进行先期设定,数据倾斜修正算法根据首个计算阶段的统计信息进行数据重新划分和并行度修正,由异构节点任务分配算法对集群不同计算能力的工作节点进行合理的任务分配,从而提高数据计算量与节点计算能力的适配性,优化Spark集群的整体性能.实验结果表明:在不同作业类型、不同数据集条件下,算法均取得了一定的性能提升,并能有效减少工作节点外存溢写的概率.
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...