改进的FP—GrOWTH算法及其分布式并行实现

2016-09-12 22:50:17马月坤刘鹏飞张振友孙燕丁铁凡
哈尔滨理工大学学报 2016年2期
关键词:分布式计算剪枝项集

马月坤 刘鹏飞 张振友 孙燕 丁铁凡

摘要:针对传统FP-Growth算法在大规模数据环境下挖掘效率低下的问题,提出了一种改进的FP-Growth算法。该算法主要是通过基于频繁闭项集策略对完备模式树进行剪枝进而减小搜索空间规模,达到提高算法挖掘效率的目的。并将改进后的FP-Growth算法的分治策略与分布式计算框架Hadoop的MapReduce编程模式有机结合,进一步提高了大数据环境下的挖掘效率。实验证明,基于Hadoop的改进FP-Growth算法的效率较传统FP-Growth算法有所提高。endprint

猜你喜欢
分布式计算剪枝项集
人到晚年宜“剪枝”
保健医苑(2022年5期)2022-06-10 07:47:22
基于YOLOv4-Tiny模型剪枝算法
剪枝
天津诗人(2017年2期)2017-03-16 03:09:39
基于云计算的移动学习平台设计与实现
软件导刊(2016年11期)2016-12-22 21:47:07
云计算中MapReduce分布式并行处理框架的研究与搭建
面向异构分布式计算环境的并行任务调度优化方法
关联规则中经典的Apriori算法研究
卷宗(2014年5期)2014-07-15 07:47:08
一种面向不平衡数据分类的组合剪枝方法
计算机工程(2014年6期)2014-02-28 01:26:33
一种频繁核心项集的快速挖掘算法
计算机工程(2014年6期)2014-02-28 01:26:12
一种新的改进Apriori算法*