Hadoop简单入门视频总结

2017-12-18 1124

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： hadoop简单介绍和简单实践视频教程慕课网： https://www.imooc.com/video/7642预备知识：liunx基本操作java开发基础知识google的大数据技术:MapReduce,BigTables,GFS革命性变化：成本降低，能用pc机就不用大型机和高端存储。

hadoop简单介绍和简单实践视频教程慕课网： https://www.imooc.com/video/7642

预备知识：

liunx基本操作
java开发基础知识

google的大数据技术:MapReduce,BigTables,GFS

革命性变化：

成本降低，能用pc机就不用大型机和高端存储。
软件容错，硬件故障视为常态，通过软件保证可靠性。
简化并行分布式计算，无需控制节点同步和数据交换。

google分布式计算的开源实现 Hadoop ，由apache开发。
解决两个问题，分布式存储和分布式数据处理。
对应HDFS（分布式文件系统）和MapReduce（映射规约）

Hdoop优势：

高扩展
低成本
成熟的生态圈

Hadoop 生态系统

Hive 小蜜蜂，牵引

Hbase

zookeeper

Hadoop安装

准备linux
租用云主机，比如阿里云。
jdk环境

centos下有所不同
1、下载  ： yum install java-1.7.0-openjdk
2、配置环境变量 vim /etc/profile
export JAVA_HOME=/jdk路径
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/lib:$JRE_HOME/lib:$PATH
3、让配置生效source /etc/profile
4、输入  java -version 进行测试

vim /etc/profile

配置环境变量

export JAVA_HOME=/jdk路径

export JRE_HOME=$JAVA_HOME/jre

export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/lib:$JRE_HOME/lib:$PATH

让配置生效

source /etc/profile

配置Hadoop

wegt http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz

修改四个配置文件

<!-- core-site.xml -->

  <property>

    <name>hadoop.tmp.dir</name>

    <value>/hadoop</value>

  </property>

  <property>

    <name>dfs.name.dir</name>

    <value>/hadoop/name</value>

  </property>

  <property>

    <name>fs.default.name</name>

    <value>hdfs://localhost:9000</value>

  </property>


<configuration>

<property>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

hdfs-site.xml



<property>

<name>dfs.data.dir</name>

<value>/hadoop/data</value>



</property>