一种基于Hadoop的海量web数据挖掘方法
- 专利权人:
- 浪潮集团有限公司
- 发明人:
- 王之滨,孙海峰,崔乐乐
- 申请号:
- CN201510235579.4
- 公开号:
- CN104809231A
- 申请日:
- 2015.05.11
- 申请国别(地区):
- 中国
- 年份:
- 2015
- 代理人:
- 姜明
- 摘要:
- 本发明公开一种基于Hadoop的海量web数据挖掘方法,属于计算机数据处理领域;本发明遗传算法与Hadoop的MapReduce进行融合,针对Hadoop的分布式文件存储系统HDFS中的海量Web数据进行挖掘,进一步验证该平台的高效性,在该平台上利用融合后的算法挖掘Web日志中用户的偏爱访问路径,实验结果表明,在Hadoop中运用分布式算法处理大量的Web数据,可以明显提高Web数据挖掘的效率。
- 来源网站:
- 中国工程科技知识中心