《Hadoop海量数据处理：技术详解与项目实战（第2版）》一导读-阿里云开发者社区

《Hadoop海量数据处理：技术详解与项目实战（第2版）》一导读

2017-05-02 1243

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 2013年被称为“大数据元年”，标志着世界正式进入了大数据时代，而就在这一年，我加入了清华大学苏州汽车研究院大数据处理中心，从事Hadoop的开发、运维和数据挖掘等方面的工作。从出现之日起，Hadoop就深刻地改变了人们处理数据的方式。

前言

Hadoop海量数据处理：技术详解与项目实战（第2版）
为什么要写这本书
2013年被称为“大数据元年”，标志着世界正式进入了大数据时代，而就在这一年，我加入了清华大学苏州汽车研究院大数据处理中心，从事Hadoop的开发、运维和数据挖掘等方面的工作。从出现之日起，Hadoop就深刻地改变了人们处理数据的方式。作为一款开源软件，Hadoop能让所有人享受到大数据红利，让所有人在大数据时代站在了同一起跑线上。Hadoop很好地诠释了什么是“大道至简，衍化至繁”，Hadoop来源于非常朴素的思想，但是却衍生出大量的组件，让初学者难以上手。

我在学习和工作的过程中，走过很多弯路也做过很多无用功，尽管这是学习新技术的必由之路，但却浪费了大量的时间。我将自己学习和工作的心得记录下来，为了帮助更多像我当年一样的Hadoop学习者，我决定写一本书，一本自己开始Hadoop职业生涯的时候也想读到的书。

基础篇： Hadoop基础
第1章　绪论
1.1　 Hadoop和云计算
1.2　 Hadoop和大数据
1.3　数据挖掘和商业智能
1.4　小结
第2章　环境准备
2.1　 Hadoop的发行版本选择
2.2　 Hadoop架构
2.3　安装Hadoop
2.4　安装Hive
2.5　安装HBase
2.6　安装Sqoop
2.7　 Cloudera Manager
2.8　小结
第3章　Hadoop的基石：HDFS
第4章　YARN：统一资源管理和调度平台
第5章　分而治之的智慧：MapReduce
第6章　SQL on Hadoop：Hive
第7章　SQL to Hadoop : Sqoop
第8章　HBase:HadoopDatabase
第9章　Hadoop性能调优和运维
应用篇：商业智能系统项目实战
第10章　在线图书销售商业智能系统
第11章　系统结构设计
第12章　在开发之前
第13章　实现数据导入导出模块
第14章　实现数据分析工具模块
第15章　实现业务数据的数据清洗模块
第16章　实现点击流日志的数据清洗模块
第17章　实现购书转化率分析模块
第18章　实现购书用户聚类模块
第19章　实现调度模块
结束篇：总结和展望
第20章　总结和展望

相关实践学习

简单用户画像分析

本场景主要介绍基于海量日志数据进行简单用户画像分析为背景，如何通过使用DataWorks完成数据采集、加工数据、配置数据质量监控和数据可视化展现等任务。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

《Hadoop海量数据处理：技术详解与项目实战（第2版）》一导读

前言

目录

热门文章

最新文章

相关课程

相关电子书

相关实验场景

《Hadoop海量数据处理：技术详解与项目实战（第2版）》一导读

前 言

目 录

热门文章

最新文章

相关课程

相关电子书

相关实验场景

前言

目录