weekend110(Hadoop)的 第三天笔记

简介:

课程目录

 

01-hdfs源码跟踪之打开输入流

02-hdfs源码跟踪之打开输入流总结

03-mapreduce介绍及wordcount

04-wordcount的编写和提交集群运行

05-mr程序的本地运行模式

06-job提交的逻辑及YARN框架的技术机制

07-MR程序的几种提交运行模式

08-YARN的通用性意义

09-yarn的job提交流程

 

 

 


本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/5894876.html,如需转载请自行联系原作者

相关文章
|
10月前
|
分布式计算 Hadoop 大数据
大数据 | Hadoop HA高可用搭建保姆级教程(大二学长的万字笔记)(下)
大数据 | Hadoop HA高可用搭建保姆级教程(大二学长的万字笔记)(下)
125 0
|
10月前
|
分布式计算 运维 Hadoop
大数据 | Hadoop HA高可用搭建保姆级教程(大二学长的万字笔记)(上)
大数据 | Hadoop HA高可用搭建保姆级教程(大二学长的万字笔记)(上)
278 0
|
SQL 存储 分布式计算
万字长文|Hadoop入门笔记(附资料)
大数据迅速发展,但是Hadoop的基础地位一直没有改变。理解并掌握Hadoop相关知识对于之后的相关组件学习有着地基的作用。本文整理了Hadoop基础理论知识与常用组件介绍,虽然有一些组件已经不太常用。但是理解第一批组件的相关知识对于以后的学习很有帮助,未来的很多组件也借鉴了之前的设计理念。
232 0
万字长文|Hadoop入门笔记(附资料)
|
存储 分布式计算 资源调度
Hadoop笔记
本文是学习《Hadoop权威指南》时所作的笔记,用于加深理解。
1845 0
|
存储 分布式计算 大数据
|
存储 机器学习/深度学习 分布式计算
|
12天前
|
存储 分布式计算 Hadoop
大数据处理架构Hadoop
【4月更文挑战第10天】Hadoop是开源的分布式计算框架,核心包括MapReduce和HDFS,用于海量数据的存储和计算。具备高可靠性、高扩展性、高效率和低成本优势,但存在低延迟访问、小文件存储和多用户写入等问题。运行模式有单机、伪分布式和分布式。NameNode管理文件系统,DataNode存储数据并处理请求。Hadoop为大数据处理提供高效可靠的解决方案。
36 2

相关实验场景

更多