《数据驱动安全:数据安全分析、可视化和仪表盘》一2.2 用Canopy快速开始Python分析

简介: 本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第2章 ,第2.1节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第2章 ,第2.1节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2 用Canopy快速开始Python分析

如果你熟悉和精通Python,通过我们提供的链接,可以快速可靠地安装好Python、IPython和pandas,但是我们不建议这么做。对于Python新手,基础安装包含了核心解释器以及内置的标准扩展库,就好比你已经有了便宜的画板、基础的涂料和画笔,你需要更好的材料去创造艺术作品,统计、计算、画图的库因此应运而生。即使是忠诚的Python拥护者也认为管理库文件的依赖关系以及更新众多的必要组件是一件很有挑战性的工作。而这会浪费你的时间,尤其是当你需要在不同操作系统和环境下管理分析过程时。
为了安装和维护方便,我们强烈建议使用开源软件Enthought Canopy Python数据分析开发环境(www.enthought.com/products/canopy)。Canopy运行于Linux、Microsoft Windows以及Mac OSX,拥有一个内置的Python集成开发环境,结合一个元数据包管理器,能确保依赖包和模块实时更新,并且和IPython一样有个控制台。对于那些不想使用开源解决方案的组织,Enthought同样提供Canopy的商业版本。
从(http://docs.enthought.com/canopy/quick-start.html)处能获取完整的安装、设置和升级指南,因此我们不会一步步介绍怎么在不同平台下安装Canopy,我们强烈建议在尝试本书提供的任何Python代码例子前先查看一遍文档。当你完成基本安装之后,打开Canopy应用程序,欢迎页面会显示出来(见图2-1)。
首先需要做的是指导Canopy在IPython控制台里显示所有图像。这是可选的步骤,但可保证在Canopy环境下所有输出能正确显示。当你打开Canopy编辑器会话时,你可以从Preferences窗口里找到Python标签,选择Inline(SVG)选项,来调整PyLAb Backend的偏好设置(见图2-2)。
你可以在编辑器的IPython控制台里运行如下代码来验证环境是否设置合适。
image
image

成功后的输出如图2-3所示。当完成这一切后,你已经搞定了基本的环境安装设置,可以开始用数据分析的例子进行后续工作了。如果柱状图没有显示,你应该检查你的安装步骤,或者验证刚刚提过的图像显示设置是否正常。
当一切都运转正常时,你可以花10分钟,仔细读一下Stavros Korokithakis写的《Learn Python in 10 Minutes》(www.stavros.io/tutorials/python)。如果你不熟悉Python了,你可以额外花10分钟过一下《10 Minutes to Pandas》(http://pandas.pydata.org/pandas-doc/dev/10min.html),来了解一下pandas数据分析模块。

相关文章
|
5天前
|
数据可视化 数据挖掘 Python
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化(下)
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化
13 0
|
5天前
|
数据可视化 API 开发者
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化(上)
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化
16 0
|
5天前
|
机器学习/深度学习 数据可视化 安全
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化(下)
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化
14 1
|
5天前
|
机器学习/深度学习 数据可视化 Python
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化(上)
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化
19 0
|
5天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】金融数据分析中的机器学习应用
【4月更文挑战第30天】本文探讨了机器学习在金融数据分析中的应用,如股价预测、信用评分、欺诈检测、算法交易和风险管理,并以Python为例展示了如何进行股价预测。通过使用机器学习模型,金融机构能更准确地评估风险、识别欺诈行为并优化交易策略。Python结合scikit-learn库简化了数据分析过程,助力金融从业者提高决策效率。随着技术发展,机器学习在金融领域的影响力将持续增强。
|
5天前
|
机器学习/深度学习 Python
【Python 机器学习专栏】混淆矩阵与 ROC 曲线分析
【4月更文挑战第30天】本文介绍了机器学习中评估模型性能的两种工具——混淆矩阵和ROC曲线。混淆矩阵显示了模型在不同类别上的预测情况,包括真正例、假正例、真反例和假反例,帮助评估模型错误类型和数量。ROC曲线则通过假正率和真正率展示了模型的二分类性能,曲线越接近左上角,性能越好。文章还提供了Python中计算混淆矩阵和ROC曲线的代码示例,强调它们在模型选择、参数调整和理解模型行为中的应用价值。
|
5天前
|
数据采集 数据挖掘 测试技术
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
17 1
|
5天前
|
机器学习/深度学习 存储 数据采集
【Python 机器学习专栏】PCA(主成分分析)在数据降维中的应用
【4月更文挑战第30天】本文探讨了主成分分析(PCA)在高维数据降维中的应用。PCA通过线性变换找到最大化方差的主成分,从而降低数据维度,简化存储和计算,同时去除噪声。文章介绍了PCA的基本原理、步骤,强调了PCA在数据降维、可视化和特征提取上的优势,并提供了Python实现示例。PCA广泛应用在图像压缩、机器学习和数据分析等领域,但降维后可能损失解释性,需注意选择合适主成分数量及数据预处理。
|
5天前
|
机器学习/深度学习 算法 数据可视化
Python用KNN(K-近邻)回归、分类、异常值检测预测房价、最优K值选取、误差评估可视化
Python用KNN(K-近邻)回归、分类、异常值检测预测房价、最优K值选取、误差评估可视化
|
5天前
|
Python
Python随机波动性SV模型:贝叶斯推断马尔可夫链蒙特卡洛MCMC分析英镑/美元汇率时间序列数据|数据分享
Python随机波动性SV模型:贝叶斯推断马尔可夫链蒙特卡洛MCMC分析英镑/美元汇率时间序列数据|数据分享
10 0