1. 云栖社区>
  2. 全部标签>
  3. #RDD#
RDD

#RDD#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

Spark学习[扩展阅读] 详解 Spark RDD

为了能解决程序员能在大规模的集群中以一种容错的方式进行内存计算这个问题, 我们提出了 RDDs 的概念. 当前的很多框架对迭代式算法场景与交互性数据挖掘场景的处理性能非常差, 这个是 RDDs 的提出的动机.

大数据 函数 集群 spark 编程 Mapreduce 存储 数据存储 RDD

揭秘Spark应用性能调优

在多台机器上分布数据以及处理数据是Spark的核心能力,即我们所说的大规模的数据集处理。为了充分利用Spark特性,应该考虑一些调优技术。本文每一小节都是关于调优技术的,并给出了如何实现调优的必要步骤。 本文选自《Spark GraphX实战》。

spark Graphx RDD

1
GO