【Spark Summit East 2017】R与Spark:如何使用RStudio的 Sparklyr和H2O的 Rsparkling分析数据

  1. 云栖社区>
  2. 博客>
  3. 正文

【Spark Summit East 2017】R与Spark:如何使用RStudio的 Sparklyr和H2O的 Rsparkling分析数据

小猫吃鱼569 2017-02-20 21:26:12 浏览3423
展开阅读全文

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Nathan Stephens在Spark Summit East 2017上的演讲,Sparklyr是一个让你在Spark中进行数据分析就像在R开发环境下进行数据分析的R语言包,Sparklyr 支持处理数据帧对象的常用工具dplyr的完整后端,你可以使用dplyr将R代码翻译成Spark SQL,Sparklyr还支持MLlib,所以你可以在分布式数据集上运行分类器以及回归、聚类、决策树等机器学习算法,讲义中演示了如何使用Sparklyr和Rsparkling分析数据。


5a38a80e9582d2ed243bc7d96f5f3b27daab60bd

a4d31555f86d19b0951f7d33b80546e8362643ad

6e696e1206c577aaab6994c634f0be1a32b58e5e

e296a364c19fb833341b12b2ad0551f07b21a6f6

04267ba58ab9f9526eca8de65147f72c279e75e7

de160af590d3625326373365884aa28d0457f635

ad3b45500ae86f24698bfc91effce9adb6330225

bee2c0e83a313ac0e062882892d292487c9442be

179bd359b9369a6df761bbfb8ccec92fbd41b909

9088263dee1650c4b3315798754c74817c871dee

354a78b631b5b3798da9c4269b6632199e8552f6

e584128ac595f856a227653b702816827066840a

1af6870f291b4c68c8d994d1dacde20003829633

a014bd626e836b56ccb5de858cfdcf07bddacb9c

8e2d871a839f90c4e820de5e0e9e34681da49c4f

296c4a629711cf0d7d453b777e534a7b02d71063

75e27850e270de0877b00388aaf958350b785a9e

网友评论

登录后评论
0/500
评论
小猫吃鱼569
+ 关注