备案控制台

开发者社区

开发者社区华章出版社文章正文

《Hadoop实战第2版》——2.6节本章小结

2017-08-01 1352

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本节书摘来自华章社区《Hadoop实战第2版》一书中的第2章，第2.6节本章小结，作者：陆嘉恒，更多章节内容可以访问云栖社区“华章社区”公众号查看

2.6　本章小结
本章主要讲解了Hadoop的安装和配置过程。Hadoop的安装过程并不复杂，基本配置也简单明了，其中有几个关键点：
Hadoop主要是用Java语言写的，它无法使用一般Linux预装的OpenJDK，因此在安装Hadoop前要先安装JDK（版本要在1.6以上）；
作为分布式系统，Hadoop需要通过SSH的方式启动处于slave上的程序，因此必须安装和配置SSH。
由此可见，在安装Hadoop前需要安装JDK及SSH。
Hadoop在Mac OS X上的安装与Linux雷同，在Windows系统上的安装与在Linux上有一点不同，就是在Windows系统上需要通过Cygwin模拟Linux环境，而SSH的安装也需要在安装Cygwin时进行选择，请不要忘了这一点。
集群配置只要记住conf/Hadoop-env.sh、conf/core-site.xml、conf/hdfs-site.xml、conf/mapred-site.xml、conf/mapred-queues.xml这5个文件的作用即可，另外Hadoop有些配置是可以在程序中修改的，这部分内容不是本章的重点，因此没有详细说明。

文章标签：

Linux

Windows

分布式计算

Hadoop

网络安全

关键词：

hadoop实战

华章计算机

目录

相关文章

是Yu欸

|

5月前

|

SQL 分布式计算 Hadoop

大数据行业部署实战1：Hadoop伪分布式部署

大数据行业部署实战1：Hadoop伪分布式部署

是Yu欸

146 0 0

热烈的马

|

4月前

|

分布式计算 Java 大数据

【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战（超详细附源码）

【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战（超详细附源码）

热烈的马

153 0 0

一名技术开发者

|

6月前

|

分布式计算 Hadoop 大数据

大数据Hadoop之——Apache Hudi 数据湖实战操作（Spark，Flink与Hudi整合）

大数据Hadoop之——Apache Hudi 数据湖实战操作（Spark，Flink与Hudi整合）

一名技术开发者

315 2 2

热烈的马

|

4月前

|

分布式计算大数据 Scala

【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战（超详细附源码）

【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战（超详细附源码）

热烈的马

85 1 1

云祁

|

存储 SQL 分布式计算

《离线和实时大数据开发实战》（三）Hadoop原理实战

《离线和实时大数据开发实战》（三）Hadoop原理实战

云祁

436 0 1

《离线和实时大数据开发实战》（三）Hadoop原理实战

wux_labs

|

4月前

|

分布式计算资源调度搜索推荐

《PySpark大数据分析实战》-02.了解Hadoop

大家好！今天为大家分享的是《PySpark大数据分析实战》第1章第2节的内容：了解Hadoop。

wux_labs

44 0 0

《PySpark大数据分析实战》-02.了解Hadoop

热烈的马

|

4月前

|

存储分布式计算搜索推荐

【大数据技术Hadoop+Spark】MapReduce之单词计数和倒排索引实战（附源码和数据集超详细）

【大数据技术Hadoop+Spark】MapReduce之单词计数和倒排索引实战（附源码和数据集超详细）

热烈的马

46 0 0

热烈的马

|

4月前

|

分布式计算 Hadoop 大数据

【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep（附源码）

【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep（附源码）

热烈的马

145 0 0

愿天堂没有BUG（公众号同名）

|

4月前

|

分布式计算搜索推荐 Hadoop

阿里巴巴资深架构师熬几个通宵肛出来的Spark+Hadoop+中台实战pdf

Spark大数据分析实战 1、Spark简介初识Spark Sp ark生态系统BDAS Sp ark架构与运行逻辑弹性分布式数据集

愿天堂没有BUG（公众号同名）

56 0 0

愿天堂没有BUG（公众号同名）

|

4月前

|

分布式计算算法大数据

大数据Spark企业级实战与Hadoop实战&PDF和PPT

今天给大家分享的是《大数据Spark企业级实战》与《Hadoop实战》《大数据处理系统·Hadoop源代码情景分析》《50个大厂大数据算法教程》等销量排行前10名的大数据技术书籍（文末领取PDF版）。这些书籍具有以下几个优点：易读、实践性强，对解决工作中遇到的业务问题具有一定启发性。

愿天堂没有BUG（公众号同名）

40 0 0

华章出版社

热门文章

最新文章

利用Hive与Hadoop构建大数据仓库：从零到一

Hadoop【基础知识 05】【HDFS的JavaAPI】（集成及测试）

Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】（图片来源于网络）（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

大数据处理架构Hadoop

Hadoop集群基本测试

Hadoop【hadoop学习大纲完全总结01+02+03+04+05】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】

Hadoop【问题记录 02】【hadoop-3.1.3 单机版】ResourceManager无法启动NodeManager启动后过自动关闭 javax/activation/DataSource

Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】（图片来源于网络）

【Hadoop】HDFS 读写流程

大数据Hadoop生态圈体系视频课程

hadoop的伪分布式搭建-带网盘

Hadoop的运行模式

Hadoop【hadoop学习大纲完全总结01+02+03+04+05】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】

Hadoop【基础知识 05】【HDFS的JavaAPI】（集成及测试）

Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】（图片来源于网络）（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

Hadoop【基础知识 04】【HDFS常用shell命令】（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】（图片来源于网络）

大数据技术与Python：结合Spark和Hadoop进行分布式计算

大数据处理架构Hadoop

Hadoop生态系统深度剖析：面试经验与必备知识点解析

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据Hadoop快速入门

Hadoop快速入门

Hadoop企业优化及扩展案例

相关电子书

更多

《构建Hadoop生态批流一体的实时数仓》

零基础实现hadoop 迁移 MaxCompute 之数据

CIO 指南:如何在SAP软件架构中使用Hadoop

相关实验场景

更多

搭建Hadoop环境

下一篇

阿里云oss简介和使用流程