《Python机器学习——预测分析核心算法》——导读

简介: 从数据中提取有助于决策的信息正在改变着现代商业的组织,同时也对软件开发人员产生了直接的影响。一方面是对新的软件开发技能的需求,市场分析师预计到2018年对具有高级统计和机器学习技术的人才需求缺口将达140000~190000人。

68afd61038d056231519acb955ff2c4c5381fbec

前言

Python机器学习——预测分析核心算法
从数据中提取有助于决策的信息正在改变着现代商业的组织,同时也对软件开发人员产生了直接的影响。一方面是对新的软件开发技能的需求,市场分析师预计到2018年对具有高级统计和机器学习技术的人才需求缺口将达140000~190000人。这对具有上述技能的人员来说意味着丰厚的薪水和可供选择的多种有趣的项目。另一方面对开发人员的影响就是逐步出现了统计和机器学习相关的核心工具,这减轻了开发人员的负担。当他们尝试新的算法时,不需要重复发明“轮子”。在所有通用计算机语言中,Python的开发人员已经站在了最前沿,他们已开发了当前最先进的机器学习工具包,但从拥有这些工具包到如何有效地使用它们仍然存在一定的距离。

开发人员可以通过在线课程、阅读质量上乘的书籍等方式来获得机器学习的相关知识。它们通常都对机器学习的算法、应用实例给出了精彩的阐述,但是因为当前算法如此之多,以至于很难在一门课程或一本书中覆盖全部算法的相关细节。

这给实践者带来了困难。当面临众多算法时,机器学习新手可能需要多次尝试才能做出决定,这往往需要开发人员来填补从问题提炼到最终问题解决之间的所有算法使用方便的细节。

本书尝试填补这一鸿沟,所采用的方法就是只集中于两类核心的“算法族”,这两类算法族已在广泛的应用领域中证明了其最佳的性能。此论断的证据如下:这两类算法在众多机器学习算法竞争者中已获得支配性地位,新开发的机器学习工具包都会率先支持此两类算法,以及研究工作给出的性能对比结论(见第1章)。重点关注这两类算法使我们可以更详细地介绍算法的使用原则,并通过一系列的示例细节来展示针对不同问题如何使用这些算法。

本书主要通过代码实例来展示所讨论的算法的使用原则。以我在加州山景城的黑客道场(Hacker Dojo)授课的经验来看,我发现开发人员更愿意通过直接看代码示例来了解算法原理,而不是通过数学公式推导。

本书使用Python语言,因为它能提供将功能和专业性良好结合的机器学习算法包。Python是一种经常使用的计算机语言,以产生精炼、可读性代码而著称。这导致目前已有相当数量的业界旗舰公司采用Python语言进行原型系统开发和部署。Python语言开发人员获得了广泛的支持,包括大量的同业开发人员组成的社区、各种开发工具、扩展库等等。Python广泛应用于企业级应用和科学研究领域。它有相当数量的工具包支持计算密集型应用,如机器学习。它也收集了当前机器学习领域的代表性算法(这样就可以省去重复性劳动)。Python相比专门的统计语言如R或SAS(Statistical Analysis System)是一门更通用的语言,它的机器学习算法包吸收了当前一流的算法,并且在一直扩充。

目录

第1章 关于预测的两类核心算法
1.1 为什么这两类算法如此有用
1.2 什么是惩罚回归方法
1.3 什么是集成方法
1.4 算法的选择
1.5 构建预测模型的流程
1.6 各章内容及其依赖关系
小结

第2章 通过理解数据来了解问题
2.1 “解剖”一个新问题
2.2 分类问题:用声纳发现未爆炸的水雷
2.3 对“岩石vs.水雷”数据集属性的可视化展示
2.4 基于因素变量的实数值预测:鲍鱼的年龄
2.5 用实数值属性预测实数值目标:评估红酒口感
2.6 多类别分类问题:它属于哪种玻璃
小结

第3章 预测模型的构建:平衡性能、复杂性以及大数据
第4章 惩罚线性回归模型
第5章 使用惩罚线性方法来构建预测模型
第6章 集成方法
第7章 用Python构建集成模型

相关文章
|
17小时前
|
机器学习/深度学习 数据挖掘 网络架构
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
|
1天前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
18 1
|
5天前
|
机器学习/深度学习 数据可视化 数据挖掘
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
16 1
|
5天前
|
机器学习/深度学习 Python
Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析
Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析
16 0
|
6天前
|
机器学习/深度学习 Python 数据处理
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
27 0
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
|
6天前
|
机器学习/深度学习 存储 算法
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
26 7
|
6天前
|
vr&ar Python
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列4
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列
30 0
|
8天前
|
机器学习/深度学习 数据处理 计算机视觉
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力消耗数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力消耗数据
20 1
|
8天前
|
机器学习/深度学习 人工智能 分布式计算
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
13 0
|
13天前
|
机器学习/深度学习 JavaScript 前端开发
机器学习模型部署:使用Python和Vue搭建用户友好的预测界面
【4月更文挑战第10天】本文介绍了如何使用Python和Vue.js构建机器学习模型预测界面。Python作为机器学习的首选语言,结合Vue.js的前端框架,能有效部署模型并提供直观的预测服务。步骤包括:1) 使用Python训练模型并保存;2) 创建Python后端应用提供API接口;3) 利用Vue CLI构建前端项目;4) 设计Vue组件实现用户界面;5) 前后端交互通过HTTP请求;6) 优化用户体验;7) 全面测试并部署。这种技术组合为机器学习模型的实用化提供了高效解决方案,未来有望更加智能和个性化。