开发者社区> 问答> 正文

flink和spark的最大区别是什么来着?就是双重groupby报错的那段

转自钉钉群21789141:flink和spark的最大区别是什么来着?就是双重groupby报错的那段

展开
收起
赵慧@ApacheFlink中文社区 2018-10-18 12:59:32 2792 0
2 条回答
写回答
取消 提交回答
  • flink小助手会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关flink的问题及回答。

    性能对比

    首先它们都可以基于内存计算框架进行实时计算,所以都拥有非常好的计算性能。经过测试,Flink计算性能上略好。

    测试环境:

    CPU:7000个;
    内存:单机128GB;
    版本:Hadoop 2.3.0,Spark 1.4,Flink 0.9
    数据:800MB,8GB,8TB;
    算法:K-means:以空间中K个点为中心进行聚类,对最靠近它们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。
    迭代:K=10,3组数据

    2019-07-17 23:09:08
    赞同 展开评论 打赏
  • 大沙:image

    2019-07-17 23:09:08
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载