发布时间:2016-06-13 22:51:30 浏览:10823 回帖 :1
有这样一种场景,用户在自建服务器上存有一定数量级的CSV格式业务数据,某一天用户了解到阿里云的OSS服务存储性价比高(嘿嘿,颜值高),于是想将CSV数据迁移到云上OSS中,并且未来还想对这些数据做一些...
发布时间:2016-05-31 14:18:56 浏览:2156 回帖 :0
ODPS TUNNEL是一种支持多种数据交换的通用服务,在上传数据时可能源数据会含有一些脏数据,这里以我在生产环境中遇到NUL字符导致上传失败经历做出总结分享。
发布时间:2016-05-26 21:11:45 浏览:5489 回帖 :0
Fluentd是一个日志收集系统,可以定制输入或输出到常用系统(如MongoDB, RDS, Mysql, HDFS)或直接用于Log收集。 DHS(Datahub)向开发人员提供Fluentd插件...
发布时间:2016-04-30 17:31:45 浏览:2873 回帖 :0
基本文件命令:格式为:hadoop fs -cmd <args> 例如,文件列表命令: hadoop fs -ls
发布时间:2016-04-29 17:02:58 浏览:7776 回帖 :1
Zookeeper是一个很好的集群管理工具,被大量用于分布式计算。如Hadoop以及Storm系统中。这里简单记录下Zookeeper集群环境的搭建过程。本文以Centos6.5作为操作系统环境。
发布时间:2016-04-29 16:41:02 浏览:3684 回帖 :0
本文描述了如何安装、配置和管理有实际意义的Hadoop集群,安装Hadoop集群通常要将安装软件解压到集群内的所有机器上。通常,集群里一台机器被指定为 NameNode,另一台不同的机器被指定为Dat...