大数据初学者必备神器学习路线图

  1. 云栖社区>
  2. 博客>
  3. 正文

大数据初学者必备神器学习路线图

懂天明 2019-04-29 13:11:17 浏览662
展开阅读全文

    大数据终将主宰经济社会,消除个体差异,成就一元化的经济体系。网络经济时代,人们在经济社会中的诸种活动通过网络账户体系来实现,这些活动也就是所谓的网络账户活动,其基本内容更多地体现为账户间的关系。这些账户活动及其账户关系是由数字网络程序所设定的、驱动的,且被实时地记录下来。这就形成了所谓的“大数据”。因此,大数据来源于大量的网络账户的活动及其有效的记录,简言之,大数据是网络账户数据。

具体学习路线图如下:


6797634507ff96f68ba48bcd210c577f168809ae


第一阶段 Java语言基础阶段

1.1 Java编程语言基本概述

1.2 Java基础语法

1.3 面向对象编程

1.4 面向对象高级编程

1.5 Java中的常用类库

1.6 枚举和异常类

1.7 Java数据结构和集合框架泛型

1.8 Java中的IO流

1.9 Java中的多线程

1.10 Java中网络编程和反射

1.11 Java8新特性

1.12 Java基础加强

第二阶段 Linux系统&Hadoop生态体系

01 Linux入门

02 常用基本命令

03 系统管理

04 Linux操作增强

05 Linux shell编程

06 Hadoop生态

07 分布式系统概述

08 Hadoop入门

09 Hadoop伪分布式

10 Hadoop全分布式

11 HDFS基本概念

12 HDFS的应用开发

13 HDFS的IO流操作

14 NameNode工作机制

15 DataNode工作机制

16 Zookeeper入门

17 Zookeeper详解

18 HA框架原理

19 Hadoop-HA集群配置

20 MapReduce框架原理

21 Shuffle机制

22 Mapreduce案例一

23 Mapreduce案例二

24 Hive入门

25 Hive DDL数据定义

26 Hive分区表

27 Hive分桶表

28 Hive查询

29 Hive的高级查询Join与排序

30 Hive的函数

31 Hive DML数据管理

32 Hive文件存储

33 Hive企业级调优

34 Hive企业级调优二

35 Hive企业级项目实战

36 Flume详解

37 Sqoop详解

38 Hbase概念

39 Hbase的操作

40 Hbase整合

41 Hbase的实战和优化

第三阶段 分布式计算框架

3.1 scala

3.2 Spark Core

3.3 Spark SQL

3.4 Spark Streaming

3.5 kafka

3.6 ElasticSearch

3.7 Logstash

3.8 Kibana

3.9 Kibana

第四阶段 大数据实战项目

4.1 互金领域-广告投放

项目介绍:构建广告投放平台,进行广告投放业务,吸引潜在客户,推广产品,包含投放微服务平台、竞价模块、客户群体画像、 千人千面推荐产品。

4.2 电商平台

项目介绍: 埋点业务,进行用户细分画像、建立信用体系、进行线上各类活动。

4.3 共享单车

项目介绍: 依据用户行为轨迹构成出行规律,根据用户群体出行规律、区域情况等动态调度用车情况。

4.4 工业大数据

项目介绍:国家电网_省级输/变电监控项目:监控线路的传感设备,确保设备安全、降低故障成本,动态监控线路、变电站二次设备工作情况、报警自动化。

4.5 交通

项目介绍:贵州交通厅,交通离线/实时监控项目:通过交通卡口采集实时数据,动态监控全省各道路通行和事故状况,避免拥堵、避免交通事故、 精准测速、防止套牌和提供便捷最佳出行方案、 预测拥堵系数,为各级提供最优道路规划方案。

4.6 旅游

项目介绍:安顺智慧旅游,整合各类旅游相关应用系统及信息资源,在公安、交通、工商等相关领域实现信息共享、协同合作,共同打造良性的旅游云生态系统。

4.7 医疗

项目介绍:某市人民医院,随着老年化的持续增加,患病率越来越高。增加大数据平台,采集医疗相关数据,提高诊断的准确性,预防一些疾病的发生,监控相关病情康复进展,真正实现解决看病难,降低发病率等。

第五阶段 大数据分析

5.1 Data Analyze数据分析基础

5.2 工作环境准备

5.3 数据可视化的概念与准则

5.4 Python机器学习

5.5 选择模型

5.6 构建树的过程

5.7 网格搜索

5.8 sklearn中有三类朴素贝叶斯算法

5.9 颜色特征

5.10 手写数字识别

5.11 文本的基本组成

5.12 文本的基本组成

大数据人才高度缺乏,人才需求量大。IT里面有很多职位可以选择,为什么要选择进入大数据圈子?原因正是大数据的光明前景,大数据风口在这里。学习大数据技术就在此刻!

网友评论

登录后评论
0/500
评论
懂天明
+ 关注