您的位置: 首页 > 中文期刊论文 > 详情页

异构Spark集群数据倾斜修正调度策略

作   者:
卞琛修位蓉于炯
作者机构:
广东金融学院互联网金融与信息工程学院新疆大学信息科学与工程学院广州商学院信息技术与工程学院
关键词:
异构集群数据倾斜并行调度数据分配Spark
期刊名称:
计算机工程与科学
i s s n:
1007-130X
年卷期:
2022 年 44 卷 004 期
页   码:
620-630
摘   要:
异构Spark集群存在木桶效应,不合理的并行度导致任务分配与工作节点计算能力的适配性较差,进而影响集群计算效率和资源利用率.针对这一问题,首先建立模型,分析数据分布、并行度参数和节点任务分配的耦合关系,提出算法的优化目标,设计异构Spark集群的数据倾斜修正调度策略DSCS,包括并行度预估算法、数据倾斜修正算法和异构节点任务分配算法.预估算法对并行度进行先期设定,数据倾斜修正算法根据首个计算阶段的统计信息进行数据重新划分和并行度修正,由异构节点任务分配算法对集群不同计算能力的工作节点进行合理的任务分配,从而提高数据计算量与节点计算能力的适配性,优化Spark集群的整体性能.实验结果表明:在不同作业类型、不同数据集条件下,算法均取得了一定的性能提升,并能有效减少工作节点外存溢写的概率.
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充