本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.6节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.6 高性能算法
伴随着数据集规模的增长,对高性能关联/模式挖掘算法的要求也随之增加。
随着Hadoop和其他类MapReduce平台的提出,满足这些需求成为可能。相关内容将于后续章节中进行介绍。根据数据集的大小,可以对某些算法进行调整以防止算法循环调用导致的栈空间不足问题,这也给我们将这些算法转化到MapReduce平台时带来了挑战。