备案控制台

开发者社区华章出版社文章正文

《Hadoop大数据分析与挖掘实战》——1.6节小结

2017-05-02 1342

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自华章社区《Hadoop大数据分析与挖掘实战》一书中的第1章，第1.6节小结，作者张良均　樊哲　赵云龙　李成华　，更多章节内容可以访问云栖社区“华章社区”公众号查看

1.6　小结
本章从一个知名餐饮企业经营过程中存在的困惑出发，引出数据挖掘的概念、基本任务、建模过程。针对建模过程，简要分析了定义挖掘目标、数据取样、数据探索、数据预处理以及挖掘建模的各个算法概述和模型评价。最后，针对餐饮企业规模的日益扩大，企业数据的巨幅增长，引出了餐饮服务中的大数据应用。
如何帮助企业从数据中洞察商机，提取价值，这是现阶段几乎所有企业都关心的问题。通过发生在身边案例，由浅入深引出深奥的数据挖掘理论，让读者在不知不觉中感悟到数据挖掘的非凡魅力！

文章标签：

算法

大数据

分布式计算

Hadoop

数据挖掘

关键词：

hadoop实战

hadoop大数据分析

hadoop大数据分析挖掘实战

华章计算机

目录

相关文章

是Yu欸

|

6月前

|

SQL 分布式计算 Hadoop

大数据行业部署实战1：Hadoop伪分布式部署

大数据行业部署实战1：Hadoop伪分布式部署

是Yu欸

189 0 0

热烈的马

|

5月前

|

分布式计算 Java 大数据

【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战（超详细附源码）

【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战（超详细附源码）

热烈的马

278 0 0

一名技术开发者

|

7月前

|

分布式计算 Hadoop 大数据

大数据Hadoop之——Apache Hudi 数据湖实战操作（Spark，Flink与Hudi整合）

大数据Hadoop之——Apache Hudi 数据湖实战操作（Spark，Flink与Hudi整合）

一名技术开发者

371 2 2

热烈的马

|

5月前

|

分布式计算大数据 Scala

【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战（超详细附源码）

【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战（超详细附源码）

热烈的马

98 1 1

wux_labs

|

5月前

|

分布式计算资源调度搜索推荐

《PySpark大数据分析实战》-02.了解Hadoop

大家好！今天为大家分享的是《PySpark大数据分析实战》第1章第2节的内容：了解Hadoop。

wux_labs

52 0 0

《PySpark大数据分析实战》-02.了解Hadoop

热烈的马

|

5月前

|

存储分布式计算搜索推荐

【大数据技术Hadoop+Spark】MapReduce之单词计数和倒排索引实战（附源码和数据集超详细）

【大数据技术Hadoop+Spark】MapReduce之单词计数和倒排索引实战（附源码和数据集超详细）

热烈的马

57 0 0

热烈的马

|

5月前

|

分布式计算 Hadoop 大数据

【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep（附源码）

【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep（附源码）

热烈的马

162 0 0

愿天堂没有BUG（公众号同名）

|

5月前

|

分布式计算搜索推荐 Hadoop

阿里巴巴资深架构师熬几个通宵肛出来的Spark+Hadoop+中台实战pdf

Spark大数据分析实战 1、Spark简介初识Spark Sp ark生态系统BDAS Sp ark架构与运行逻辑弹性分布式数据集

愿天堂没有BUG（公众号同名）

60 0 0

愿天堂没有BUG（公众号同名）

|

5月前

|

分布式计算算法大数据

大数据Spark企业级实战与Hadoop实战&PDF和PPT

今天给大家分享的是《大数据Spark企业级实战》与《Hadoop实战》《大数据处理系统·Hadoop源代码情景分析》《50个大厂大数据算法教程》等销量排行前10名的大数据技术书籍（文末领取PDF版）。这些书籍具有以下几个优点：易读、实践性强，对解决工作中遇到的业务问题具有一定启发性。

愿天堂没有BUG（公众号同名）

44 0 0

是Yu欸

|

6月前

|

分布式计算 Hadoop 大数据

:大数据行业部署实战3：基于Hadoop的Web版的云盘

:大数据行业部署实战3：基于Hadoop的Web版的云盘

是Yu欸

194 0 0

华章出版社

热门文章

最新文章

Apache Hadoop YARN基本架构

Hadoop存储与计算分离实践

Hadoop数据迁移MaxCompute最佳实践

后Hadoop时代，我们该如何去架构自己的大数据平台

Hadoop迁移MaxCompute神器之DataX-On-Hadoop使用指南

Hadoop工作流--ChainMapper/ChainReducer？（三）

Hadoop概念学习系列之再谈hadoop集群里的本地模式、伪分布模式和全分布模式（三十七）

转载：Hadoop权威指南学习笔记

weekend110（Hadoop）的第二天笔记

Apache Hadoop YARN基本架构

使用Hadoop和Nutch构建音频爬虫：实现数据收集与分析

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(Hadoop3.1.3版本配置)

百度搜索：蓝易云【Ubuntu搭建全分布式Hadoop】

hadoop升级流程

使用Sqoop将数据从Hadoop导出到关系型数据库

使用Sqoop将数据导入Hadoop的详细教程

Hadoop和Hive中的数据倾斜问题及其解决方案

Hadoop生态各个组件的关系

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据Hadoop快速入门

Hadoop快速入门

Hadoop企业优化及扩展案例

相关电子书

更多

《构建Hadoop生态批流一体的实时数仓》

零基础实现hadoop 迁移 MaxCompute 之数据

CIO 指南:如何在SAP软件架构中使用Hadoop

相关实验场景

更多

基于Hologres+PAI+计算巢，5分钟搭建企业级AI问答知识库

倚天大数据电商数据分析快速实践

利用大模型大规模分发技术，实现AIGC在线应用秒级弹性

Lindorm AIGC：十分钟搞定智能问答 + 多模态检索

基于数据湖架构的网站访问行为分析

Github实时数据分析与可视化

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）