学了这么久,你知道Python机器学习全流程是怎样的么?

  1. 云栖社区>
  2. Python爱好者社区>
  3. 博客>
  4. 正文

学了这么久,你知道Python机器学习全流程是怎样的么?

技术小能手 2018-10-18 15:02:48 浏览1296
展开阅读全文

首先介绍一下机器学习的概念和地位,和其他的区别是?

281b11cfeaeb30b1960db9271d7c6fbf3c60f07a

机器学习的核心任务是?

9d11bd430a0a1e19b578814fca63e61b50ea4aab

机器学习的全流程是?

47ba2e48365db62888665050b3e645df4bfec6c4

我们将上述流程拆解出来看:

1.需求来源是?需求天上来?被提需求到底是接还是不接?

ab96c3402db430499e102cfef5c7e803c71d0c2a

2.老板说没有数据!还不舍得花钱买!让我自己想办法获取!还得谢谢老板点明方向,这可怎么办?

dbcdbbac9bb86676f9ae23e1e5f6f38ed43c0818

那你得会数据采集!

Python网络爬虫就是一种数据采集手段,简单来说就是个请求&解析的过程

那如何快速上手网络爬虫呢?

84dde16210ea1da906c159b098f8454fe15e8cd2

你需要掌握以下内容并灵活选择应用:

常用的请求库:urllib、requests

常用的解析库:BeautifulSoup、lxml

还有灵巧的信息提取方式:css选择器/xpath表达式

静态网页 & 动态网页爬取方法等等

3.需求方给的数据一团糟,我该如何搞?

7f59bdecd1961586535d15323505a04c69bdc0c6

这就涉及脏数据的处理,所谓的脏数据,就是数据不够整洁。

常见的问题有:

 ●  数据串行、尤其是




网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属团队号: Python爱好者社区