《Python数据分析与挖掘实战》一3.4 小结

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《Python数据分析与挖掘实战》一3.4 小结

华章计算机 2017-05-02 16:43:00 浏览1272
展开阅读全文

本节书摘来自华章出版社《Python数据分析与挖掘实战》一书中的第3章,第3.4节,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区“华章计算机”公众号查看

3.4 小结

本章从应用的角度出发,从数据质量分析和数据特征分析两个方面对数据进行探索分析,最后介绍了Python常用的数据探索函数及用例。数据质量分析要求我们拿到数据后先检测是否存在缺失值和异常值;数据特征分析要求我们在数据挖掘建模前,通过频率分布分析、对比分析、帕累托分析、周期性分析、相关性分析等方法,对采集的样本数据的特征规律进行分析,以了解数据的规律和趋势,为数据挖掘的后续环节提供支持。
要特别说明的是,在数据可视化中,由于主要使用Pandas作为数据探索和分析的工具,因此我们介绍的作图工具都是Matplotlib和Pandas结合使用。一方面,Matpl

网友评论

登录后评论
0/500
评论