Linux下搭建数据分析平台 superset

  1. 云栖社区>
  2. 博客>
  3. 正文

Linux下搭建数据分析平台 superset

bymain 2017-08-14 22:39:07 浏览767
展开阅读全文

安装环境:Cent os 7
软件:Anaconda3-4.4.0-Linux-x86_64.sh
汉化文件:messages.mo

1.首先需要在linux下安装Anaconda,
直接在anaconda软件目录下使用 bash Anaconda3-4.4.0-Linux-x86_64.sh 安装。
安装过程中需要输入‘y’,使得python环境变量被添加到系统中,
接下来还需要配置conda的环境变量。只需要在具体的系统环境变量中添加如下内容即可,具体路径根据实际情况调整。

export CONDA_HOME=“anconda的安装目录”
export PATH=$CONDA_HOME/bin:$PATH

2.修改Anaconda 的镜像文件
在安装Anaconda用户的家目录下创建 ‘.condarc’文件,并添加如下内容:

channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
show_channel_urls: true

3.使用pip安装superset之前需要在系统中添加如下依赖:

    a)  yum upgrade python-setuptools
    b)  yum install gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel libsasl2-devel openldap-devel

4.为了避免依赖冲突,创建superset的虚拟环境(因为之前conda环境变量已配好,所以可以直接使用如下命令)。

conda create -n superset python=3.4

5.进入superset环境,使用 source activate superset,(退出时使用source deactivate superset即可)
然后安装 pip 和setuptools最新版,命令如下:

pip install --upgrade setuptools pip

6.接下来使用pip安装superset,命令如下:

pip install superset

安装完成后进行如下设置,具体命令如下:

//创建一个admin 用户:

fabmanager create-admin --app superset

//初始化数据库

superset db upgrade

//加载一些使用的实例

superset load_examples

//创建默认的角色和初始化权限

superset init

//启动superset 的web server,端口号为8088,使用-p参数可以即时绑定当diy端口。

superset runserver

7.接下来,如果感兴趣可以实现界面的部分汉化:
(a)使用vim编辑器打开

    anaconda/envs/superset/lib/python3.4/site-packages/superset/目录下的config.py文件,需要改动的地方有两处:

1)找到Setup default language这一行,修改变量。BABEL_DEFAULT_LOCALE调整为‘zh',这样界面默认为中文。
2)将LANGUAGES字典中zh前面的注释#去掉。保存后退出。

(b)在anaconda/envs/superset/lib/python3.4/site-packages/superset/目录下执行如下命令

mkdir -p translations/zh/LC_MESSAGES

(c)进入刚创建的目录中执行如下命令即可:

wget 'https://github.com/apache/incubator-superset/blob/master/superset/translations/zh/LC_MESSAGES/messages.mo'

8.打开浏览器输入

http://ip:8088即可访问,输入6步骤中创建的用户名和密码即可进入。

9.一个小的测试:
点击数据源,(mysql数据源)
需要使用pip安装pymysql命令如下

pip install pymysql

,然后填写数据库相关信息,具体填充内容如下图示例所示。

这里写图片描述

 1)其中mysql是数据库类型,pymysql是驱动程序,表示用pymysql连接mysql数据库,+号不能省略
 2)bymain为mysql数据库的username, ‘:’后面是password,后面。localhost是数据库地址,因为我的是本地环境,所以localhost即可,也可以是127.0.0.1。3306是端口,一般默认这个。mahout是需要连接的数据库,也是我自己设的名字。后面带参数charset=utf8,表示编码,因为表里面有中文。
 3)点击测试,提示 seems ok表示连接成功!,然后点击保存即可。
 4)然后点击右上角的SQL工具箱,里面的SQL编辑器。左边选择数据库,表后,在右边既可以进行数据sql查询,如下所示。

这里写图片描述
接着选择对应维度后,就可以出BI报表图了。效果示例如下:

这里写图片描述

10.更多的功能需要大家去学习,例如kylin+superset, 数据源用redis等等。

网友评论

登录后评论
0/500
评论
bymain
+ 关注