Python数据挖掘 环境搭建

简介: deepin有很多小伙伴想学习python,但windows写python基本是坑,deepin属于linux分支,界面美观,内置大量桌面软件,对新手十分友好,这里尝试在深度系统(deepin)内安装python开发工具 jupyt...
deepin

有很多小伙伴想学习python,但windows写python基本是坑,deepin属于linux分支,界面美观,内置大量桌面软件,对新手十分友好,这里尝试在深度系统(deepin)内安装python开发工具 jupyter,并完成一个绘制折线图的入门案例

将默认的bash更换为zsh(个人喜好,可跳过)

  • 首先,安装zsh:
sudo apt-get install zsh
  • 先安装git
sudo apt-get install git
  • 再安装oh-my-zsh
sudo wget https://github.com/robbyrussell/oh-my-zsh/raw/master/tools/install.sh -O - | sh
  • 切换到 zsh 模式
chsh -s /usr/local/bin/zsh
  • 配置.zshrc(可跳过)
cd ~
git clone git://github.com/seebi/zshrc.git .zsh
cd .zsh/
make install

安装python2, python3

sudo apt install python2
sudo apt install python3

安装pip

sudo apt install python-pip

安装pip3

sudo apt install python3-pip

apt安装virtualenv

sudo apt install virtualenv

pip安装virtualenv

pip install virtualenv

pip安装virtualenvwrapper

pip install virtualenvwrapper

配置virtualenvwrapper

  • 默认查看virualenvwrapper.sh的位置为
$HOME/.local/bin/virtualenvwrapper.sh
  • .zshrc底部新增
export WORKON_HOME=$HOME/.virtualenvs
source $HOME/.local/bin/virtualenvwrapper.sh
新增virtualenvwrapper配置项
  • 在shell中执行
source $HOME/.zshrc

创建python2和python3虚拟开发环境

  • 查看python2解释器所在位置(这里得到的路径为/usr/bin/python2.7)
whereis python2
  • 创建python2开发环境
mkvirtualenv py2 -p /usr/bin/python2.7
  • 查看python3解释器所在位置(这里得到的路径为/usr/bin/python3.5)
whereis python3
  • 创建python3开发环境
mkvirtualenv py3 -p /usr/bin/python3.5

virtualenvwrapper的使用

  • 进入到python2环境
workon py2
  • 从python2切换到python3环境(切换和进入是同一个命令)
workon py3
  • 虚拟环境中安装软件(以jupyter为例)
# 安装jupyter
pip3 install jupyter
  • virtualenvwrapper命令扩展(新手安装环境,请直接跳过)
#导出 虚拟环境中的包(备份)
pip freeze > requirements.txt
# 导入 安装备份的包信息(恢复)
pip install -r requirements.txt
# 退出虚拟环境
deactivate
# 删除虚拟环境
rmvirtualenv 环境名

jupyter启动

# 进入刚刚安装jupyter的虚拟环境
workon py3

# 开启jupyter
jupyter notebook

启动jupyter
在py3下新建工作空间
jupyter跑起来

在jupyter中安装 matplotlib 进行绘图(绘制折线图,并保存)

pip install matplotlib
import matplotlib.pyplot as plt
import random
import matplotlib.pyplot as plt
# 保证生成的图片在浏览器内显示
%matplotlib inline
plt.rcParams['font.family'] = ['Arial Unicode MS', 'sans-serif']
# 指定画板的大小等等
plt.figure(figsize=(6, 6), dpi=100)

# 指定axis的一些坐标点,必须是列表
x = [1,2,3,4,5,6,7]
y = [107,17,108,15,101,11,102]

# 画出折线图
plt.plot(x, y)

# 将图片保存在文件同级目录下(必须在show()的前面调用)
plt.savefig("./test.png")

# 最终显示图
plt.show()

代码分开执行
执行效果
目录
相关文章
|
11天前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。
|
1天前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
16 1
|
1天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
10 2
|
2天前
|
Python
如何使用Python的Pandas库进行数据缺失值处理?
Pandas在Python中提供多种处理缺失值的方法:1) 使用`isnull()`检查;2) `dropna()`删除含缺失值的行或列;3) `fillna()`用常数、前后值填充;4) `interpolate()`进行插值填充。根据需求选择合适的方法处理数据缺失。
28 9
|
4天前
|
索引 Python
如何使用Python的Pandas库进行数据透视表(pivot table)操作?
使用Pandas在Python中创建数据透视表的步骤包括:安装Pandas库,导入它,创建或读取数据(如DataFrame),使用`pd.pivot_table()`指定数据框、行索引、列索引和值,计算聚合函数(如平均分),并可打印或保存结果到文件。这允许对数据进行高效汇总和分析。
10 2
|
5天前
|
JSON 关系型数据库 数据库
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
30 0
|
6天前
|
机器学习/深度学习 Python 数据处理
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
27 0
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
|
6天前
|
存储 机器学习/深度学习 数据可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
49 6
|
6天前
|
机器学习/深度学习 数据采集 供应链
从数据到决策:scikit-learn在业务分析中的应用
【4月更文挑战第17天】本文探讨了scikit-learn在业务分析中的应用,包括数据预处理、分类、回归和聚类模型的构建,以及模型评估与优化。通过使用scikit-learn,企业能有效处理数据、预测趋势、客户细分并制定决策,从而提升经营效率和市场策略。随着机器学习的发展,scikit-learn在业务分析领域的潜力将持续释放,创造更多价值。
|
6天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
11 0