已有24人关注此标签
作者: wjj5699121
1481人浏览
2人回答
如题,spark集群搭建好,如何通过java web提交任务让spark处理,并返回结果集给页面显示。可以通过哪些技术实现???有没有实践过的,分享一下经验或者思路。想达到的效果是,通过页面一个按钮,spark处理数据,然后页面显示结果
作者: freeboy_mallco
1223人浏览
0人回答
Oozie提交Sparkstreaming程序到yarn运行后,Sparkstreaming会一直处于Running状态,kill掉Oozie的工作流后,已提交到yarn的Sparkstreaming还是在运行,如何优雅的停止它?
大家好。我在测试使用E-mapreduce中的spark streaming来采集Loghub的数据时,遇到点问题。我用Loghub监控一个文本文件,采用的是极简模式。该文本文件,每隔三秒生成一个1到10的随机数,如下图所示。 我修改了E…
监控 HTTPS 集群 测试 spark scala e-mapreduce EMR sparkstreaming loghub
e-mapreduce运行任务时 经常报错Caused by: java.lang.OutOfMemoryError: Java heap space 查看系统内存都是正常的,这个内存怎么配置呢 ?
相同地域,不同可用区下的E-MapReduce的节点与我其他的ecs主机内网是否通?不同地域下,E-MapReduce的节点与我其他的ecs主机内网是否通?不同账号下,相同地域E-MapReduce的节点与我其他的ecs主机内网是否通?
大家好,我正在使用阿里云的产品,现在公司要求使用spark访问Hbase,如何将一个Rdd写入Hbase,java语言,求指导
com.esotericsoftware.kryo.KryoException: java.io.IOException: No space left on device 请问报这个错是什么意思?我是把数据保存在oss上的
作者: sunzonedu
1771人浏览
2人回答
1).在阿里云服务器集群上构建了 spark集群环境2).master 和 slaves都配的是外网ip3).启动页面后,在网页上查看各节点计算信息时,链接的都是内网IP4).需求是想通过外网直接访问各节点的页面信息
您好,我在用EMR的时候一个key对应140W的value,用附件中的配置去跑,怎么调试都是内存溢出,能给我们这边建议的设置吗?SparkConf的设置 和 服务器应该使用什么样的配置?