您的位置:
首页
>
中文期刊论文
>
详情页
基于CUDA的k-means算法并行化研究
- 作 者:
-
刘端阳;
郑江帆;
沈国江;
刘志;
- 作者机构:
-
浙江工业大学计算机科学与技术学院;
- 关键词:
-
CUDA;
k-means;
并行计算;
大数据;
- 期刊名称:
- 计算机科学
- 基金项目:
-
非高斯噪声环境下的网络二元混合分布式参数估计算法研究
- i s s n:
- 1002-137X
- 年卷期:
-
2018 年
11 期
- 页 码:
- 292-297
- 摘 要:
-
k-means算法在面对大规模数据集时,计算时间将随着数据集的增大而成倍增长。为了提升算法的运算性能,设计了一种基于CUDA(Compute Unified Device Architecture)编程模型的并化行k-means算法,即GS_k-means算法。对k-means算法进行了并行化分析,在距离计算前,运用全局选择判断数据所属聚簇是否改变,减少冗余计算;在距离计算时,采用通用矩阵乘加速,加快计算速度;在簇中心点更新时,将所有数据按照簇标签排序分组,将组内数据简单相加,减少原子内存操作,从而提高整体性能。使用KDDCUP99数据集对改进算法进行实验,结果表明,在保证实验结果的准确性的情况下,改进算法加快了计算速度,与经典的GPUMiner算法相比加速比提升5倍。
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...