您的位置: 首页 > 中文期刊论文 > 详情页

基于CUDA的k-means算法并行化研究

作   者:
刘端阳郑江帆沈国江刘志
作者机构:
浙江工业大学计算机科学与技术学院
关键词:
CUDAk-means并行计算大数据
期刊名称:
计算机科学
基金项目:
非高斯噪声环境下的网络二元混合分布式参数估计算法研究
i s s n:
1002-137X
年卷期:
2018 年 11 期
页   码:
292-297
摘   要:
k-means算法在面对大规模数据集时,计算时间将随着数据集的增大而成倍增长。为了提升算法的运算性能,设计了一种基于CUDA(Compute Unified Device Architecture)编程模型的并化行k-means算法,即GS_k-means算法。对k-means算法进行了并行化分析,在距离计算前,运用全局选择判断数据所属聚簇是否改变,减少冗余计算;在距离计算时,采用通用矩阵乘加速,加快计算速度;在簇中心点更新时,将所有数据按照簇标签排序分组,将组内数据简单相加,减少原子内存操作,从而提高整体性能。使用KDDCUP99数据集对改进算法进行实验,结果表明,在保证实验结果的准确性的情况下,改进算法加快了计算速度,与经典的GPUMiner算法相比加速比提升5倍。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充