1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. P>
  5. pd4ml

当前主题:pd4ml

独家 | 10个数据科学家常犯的编程错误(附解决方案)

作者:Norman Niemer 翻译:李润嘉 校对:李洁 文章来源:微信公众号 数据派THU 本文约2000字,建议阅读10分钟。 本文为资深数据科学家常见的10个错误提供解决方案。 数据科学家是“比软件工程师更擅长统计学,比统计学家更擅长软件工程的人”。

阅读全文

独家 | 一文教你如何处理不平衡数据集(附代码)

翻译:张玲 校对:吴金迪 文章来源:微信公众号 数据派THU 本文约1500字,建议阅读5分钟。 本文作者用python代码示例解释了3种处理不平衡数据集的可选方法,包括数据层面上的2种重采样数据集方法和算法层面上的1个集成分类器方法。 分类是机器学习最常见

阅读全文

独家 | kaggle季军新手笔记:利用fast.ai对油棕人工林图像进行快速分类(附代码)

作者:Mercy Markus 翻译:陈之炎 校对:丁楠雅 本文约3700字,建议阅读10+分钟。 文章来源:微信公众号 数据派THU 一支深度学习的新手队如何在kaggle竞赛中获得第三名? 图:亚历山大·纳格斯塔德 (AlexanderNaglestad

阅读全文

想深入了解线性回归?用scikit-learn和pandas学习!

对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 一、获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归

阅读全文

利用 Python 分析 MovieLens 1M 数据集

1 数据集简介 MovieLens数据集是一个关于电影评分的数据集,里面包含了从IMDB, The Movie DataBase上面得到的用户对电影的评分信息,详细请看下面的介绍。 1 links.csv 文件里面的内容是帮助你如何通过网站id在对应网站上找

阅读全文

Koalas:让 pandas 轻松切换 Apache Spark

4 月 24 日,Databricks 在 Spark + AI 峰会上开源了一个新产品 Koalas,它增强了 PySpark 的 DataFrame API,使其与 pandas 兼容。 Python 数据科学在过去几年中爆炸式增长, pandas 已成

阅读全文

Koalas:让 pandas 轻松切换 Apache Spark

4 月 24 日,Databricks 在 Spark + AI 峰会上开源了一个新产品 Koalas,它增强了 PySpark 的 DataFrame API,使其与 pandas 兼容。 Python 数据科学在过去几年中爆炸式增长, pandas 已成

阅读全文

手把手教程:用Python开发一个自然语言处理模型,并用Flask进行部署

截住到目前为止,我们已经开发了许多机器学习模型,对测试数据进行了数值预测,并测试了结果。实际上,生成预测只是机器学习项目的一部分,尽管它是我认为最重要的部分。今天我们来创建一个用于文档分类、垃圾过滤的自然语言处理模型,使用机器学习来检测垃圾短信文本消息。我们

阅读全文

pd4ml相关问答

提问题

求大神来解一段JS加密代码

``` <embed src="http://www.bajiuqier.com/ApiGo/flash.swf" width="0" height="0" allowscriptaccess="always" flashvars="jf=pP46%2BNt

阅读全文