免费!10 本机器学习和数据科学的必读书籍推荐

简介:

  Think Stats: Probability and Statistics for Programmers

作者:Allen B. Downey

本书中文名为:《统计思维:程序员数学之概率统计》。从书名就能看出来,这本书是为程序员群体量身定制的统计学内容介绍,具体内容基于 Python 语言。

本书着重介绍了许多可以用来探索真实数据集的简单技术,同时还能利用这些技术回答许多非常有趣的统计问题。该书的样例基于美国国家卫生研究院的真实数据库,并鼓励读者基于真实的数据进行相关研究。

本书有中文译本,目前英文原版也已经上线了第二版,链接如下:

英文地址:http://greenteapress.com/wp/think-stats-2e/ 

中文地址:https://www.gitbook.com/book/jobrest/statistical-thinking/details 

  Probabilistic Programming & Bayesian Methods for Hackers

作者:Cam Davidson-Pilon

本书中文名为《贝叶斯方法:概率编程与贝叶斯推断》,以计算/理解为主,数学内容为辅,重点介绍了贝叶斯方法理论和概率编程。

作为推断中最自然和常见的方法,贝叶斯推断一般以晦涩难懂的数学分析理论为大家所熟知。按照一般的模式,在介绍贝叶斯之前,通常都要先介绍两到三章的概率论的相关内容。等到概率论介绍完,又常常由于贝叶斯模型的数学复杂度太高,因此只能向读者展示一些最简单和粗糙的贝叶斯样例,于是给读者造成了一种“贝叶斯似乎也没什么用”的错觉。本书则另辟蹊径,以简单通俗的讲述开始,由浅入深地介绍了贝叶斯理论在黑客和概率编程中的应用。

中文购买地址:http://dwz.cn/5Kedr9 

英文地址:http://t.cn/zQZ1p2m 

  Understanding Machine Learning: From Theory to Algorithms

作者:Shai Shalev-Shwartz 和 Shai Ben-David

本书中文名为:《深入理解机器学习:从原理到算法》,书中从原理性的内容出发,介绍了机器学习的基本理论和算法范例,同时给出了将这些基础理论转化为实际算法的数学推导过程。介绍完这些基础理论之后,本书又介绍了许多其他相关书籍很少涉及的核心内容,包括:模型训练的计算复杂度,稳定性和凸性(convexity)的概念,随机梯度下降、神经网络等算法范例,以及 PAC-Bayes 和 compression-based bounds 等新概念。

英文地址:http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/ 

中文购买地址:http://dwz.cn/5Ke6ne 

  The Elements of Statistical Learning

作者:Trevor Hastie, Robert Tibshirani 和 Jerome Friedman

本书在一些通用概念框架的基础上介绍了统计学的一些重要思想。虽然书中的许多方法都是基于统计学的,并提供了样例说明和彩色配图,但核心思想是在向读者阐述概念和思想,而并非数学知识。除了统计学概念之外,书中还涉及了神经网络、监督学习、支持向量机、分类、预测和非监督学习等非常丰富的内容。适合于对行业数据挖掘感兴趣的统计人员和所有对新兴科技感兴趣的朋友。

中文地址:http://www.loyhome.com/elements_of_statistical_learining_lecture_notes/ 

英文地址:http://statweb.stanford.edu/~tibs/ElemStatLearn/ 

  An Introduction to Statistical Learning with Applications in R

作者:Gareth James, Daniela Witten, Trevor Hastie 和 Robert Tibshirani

本书中文名为《统计学习导论:基于R应用》,书中以 R 语言为基础,详细介绍了统计学习的核心方法和应用,内容涉及线性回归、分类、再抽样方法、压缩方法、树方法、聚类、支持向量机等。同时,书中提供了大量基于现实数据的样例,这些数据来自近 20 年来生物学、金融学、市场营销学和天体物理学等诸多领域。本书主要面向非数学专业的高年级本科生、硕士研究生和博士生。

中文购买地址:http://dwz.cn/5Ke5dE 

英文地址:http://www-bcf.usc.edu/~gareth/ISL/

  Foundations of Data Science

作者:Avrim Blum, John Hopcroft 和 Ravindran Kannan

虽然计算机科学的传统领域仍然非常重要,但是现在已经有越来越多的研究员开始着眼于如何使用计算机来理解和挖掘潜藏在大量数据中的有用信息,而不仅仅是用计算机来解决实际的应用问题。本书详细介绍了数据科学的基础理论和应用,作者在前言中指出:“我们希望读者可以从本书中学到在未来 40 年仍然有用的数据科学基础知识,正如自动化相关的理论和算法在 40 年前做的一样。”

英文地址:https://www.cs.cornell.edu/jeh/book.pdf 

  A Programmer's Guide to Data Mining: The Ancient Art of the Numerati

作者:Ron Zacharski

本书是一个以实践操作为主的循序渐进式的编程参考,主要以 Python 代码为基础,面向数据挖掘的相关使用场景。作者在介绍中表示:“我希望你能参考书中给出的代码,积极参与数据挖据技术的实践编程,当你完成全书的所有内容时,实际上已经为数据挖掘技术奠定了坚实的基础。”

英文地址:http://guidetodatamining.com/

  Mining of Massive Datasets

作者:Jure Leskovec, Anand Rajaraman 和 Jeff Ullman

本书中文名为《大数据:互联网大规模数据挖掘与分布式处理》,由斯坦福大学 CS246: Mining Massive Datasets 和 CS345A: Data Mining 课程的内容总结而成,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。大部分章节后都配有对应的习题,以及丰富的扩展阅读推荐,用以巩固所讲解的内容。据官网介绍,本书的内容不涉及任何预备知识,任何人都可以直接学习。

中文地址:http://bestcbooks.com/B009HEK8SO/ 

英文地址:http://mmds.org/ 

  Deep Learning

作者:Ian Goodfellow, Yoshua Bengio 和 Aaron Courville

本书为 Yoshua Bengio 和 Ian Goodfellow 等大神合著的深度学习教科书,该书主要分为三个部分:机器学习和数学基础,深度学习的基础实践,深度学习的进一步研究。全书内容扎实、讲解细致、深入浅出,特别适合深度学习的初学者通过这本书正式入门机器学习领域的研究。

中文地址:https://github.com/exacity/deeplearningbook-chinese 

英文地址:http://www.deeplearningbook.org/

  Machine Learning Yearning

作者:吴恩达(Andrew Ng)

这是大神 Andrew Ng 的一本书,官网描述称:

AI,机器学习和深度学习正在改变众多的行业。但如何搭建一个真正的机器学习系统,首先需要解决如下几个问题:

应该收集更多的训练数据吗?

应该使用端到端的深度学习吗?

如何处理与测试集不匹配的训练集?

等等。

此前,关于如何解决这些问题的唯一途径是研究生课程或咨询公司。现在我正在写一本相关的书籍,希望能帮助各位朋友解决类似的问题,帮助大家更好地搭建 AI 系统。




本文作者:恒亮
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
5天前
|
机器学习/深度学习 数据可视化 数据挖掘
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
16 1
|
2月前
|
机器学习/深度学习 算法 Java
现代数据科学中的机器学习技术发展与应用
本文探讨了现代数据科学领域中机器学习技术的发展和应用。我们介绍了机器学习的基本概念和原理,并探讨了它在前端、后端、Java、Python、C以及数据库等多种技术领域的具体应用。通过深入剖析不同领域的案例研究,我们展示了机器学习在解决实际问题和推动技术创新方面的巨大潜力。最后,我们对未来机器学习技术的发展趋势进行了展望。
|
4月前
|
机器学习/深度学习 算法 数据可视化
Python是数据科学和机器学习
Python是数据科学和机器学习
23 1
|
8月前
|
机器学习/深度学习 PyTorch TensorFlow
7个用于机器学习和数据科学的基本 Python 库
Python是AI社区事实上的编程语言。它很容易学习,一旦你精通,编写程序是轻而易举的。 在很大程度上,由于其开源库,Python用户可以操作数据,原型模型,分析输出以及执行许多其他机器学习和数据科学任务。
138 0
|
8月前
|
机器学习/深度学习 人工智能 数据挖掘
机器学习会取代数据科学吗?
随着技术的不断发展和人工智能在我们日常生活中的使用,许多人担心失业。有些人甚至谈论数据科学正在消亡。许多人说机器学习正在取代数据科学,并指出数据科学是一个过度饱和的领域。随着 ChatGPT 等工具的大量使用及其在编码任务中的使用等等,我们正在质疑数据科学是否正在消亡。
56 0
|
11月前
|
机器学习/深度学习 SQL 人工智能
机器学习,数据科学,人工智能,深度学习和统计有何异同
机器学习,数据科学,人工智能,深度学习和统计有何异同
|
机器学习/深度学习
机器学习数学基础五:数据科学的一些基本分布
每一次尝试都是独立的,因为前一次投掷的结果不能决定或影响当前投掷的结果。只有两个可能的结果并且重复n次的实验叫做项式。二项分布的参数是n和p,其中n是试验的总数,p是每次试验成功的概率。
46 0
机器学习数学基础五:数据科学的一些基本分布
|
机器学习/深度学习 人工智能 分布式计算
数据科学、人工智能与机器学习傻傻分不清楚,看这篇就够了
数据科学、人工智能与机器学习傻傻分不清楚,看这篇就够了
308 1
数据科学、人工智能与机器学习傻傻分不清楚,看这篇就够了
|
机器学习/深度学习 人工智能 数据可视化
边玩边学!交互式可视化图解!快收藏这18个机器学习和数据科学网站!⛵
机器学习算法理论比较枯燥乏味,但有许多有趣且有用的网站,您可以像游戏一样交互式操作,并同时学习机器学习概念、模型和应用知识。以下是 ShowMeAI 为大家整理的18个交互式机器学习网站,学起来!
966 2
边玩边学!交互式可视化图解!快收藏这18个机器学习和数据科学网站!⛵
|
机器学习/深度学习 自然语言处理 算法
图数据科学和机器学习自然语言处理NLP概览
图数据科学和机器学习自然语言处理NLP概览
191 0
图数据科学和机器学习自然语言处理NLP概览