Linux下搭建数据分析平台 superset

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 安装环境:Cent os 7 软件:Anaconda3-4.4.0-Linux-x86_64.sh 汉化文件:messages.mo1.首先需要在linux下安装Anaconda, 直接在anaconda软件目录下使用 bash Anaconda3-4.4.0-Linux-x86_64.sh 安装。

安装环境:Cent os 7
软件:Anaconda3-4.4.0-Linux-x86_64.sh
汉化文件:messages.mo

1.首先需要在linux下安装Anaconda,
直接在anaconda软件目录下使用 bash Anaconda3-4.4.0-Linux-x86_64.sh 安装。
安装过程中需要输入‘y’,使得python环境变量被添加到系统中,
接下来还需要配置conda的环境变量。只需要在具体的系统环境变量中添加如下内容即可,具体路径根据实际情况调整。

export CONDA_HOME=“anconda的安装目录”
export PATH=$CONDA_HOME/bin:$PATH
AI 代码解读

2.修改Anaconda 的镜像文件
在安装Anaconda用户的家目录下创建 ‘.condarc’文件,并添加如下内容:

channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
show_channel_urls: true
AI 代码解读

3.使用pip安装superset之前需要在系统中添加如下依赖:

    a)  yum upgrade python-setuptools
    b)  yum install gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel libsasl2-devel openldap-devel
AI 代码解读

4.为了避免依赖冲突,创建superset的虚拟环境(因为之前conda环境变量已配好,所以可以直接使用如下命令)。

conda create -n superset python=3.4
AI 代码解读

5.进入superset环境,使用 source activate superset,(退出时使用source deactivate superset即可)
然后安装 pip 和setuptools最新版,命令如下:

pip install --upgrade setuptools pip
AI 代码解读

6.接下来使用pip安装superset,命令如下:

pip install superset
AI 代码解读

安装完成后进行如下设置,具体命令如下:

//创建一个admin 用户:

fabmanager create-admin --app superset
AI 代码解读

//初始化数据库

superset db upgrade
AI 代码解读

//加载一些使用的实例

superset load_examples
AI 代码解读

//创建默认的角色和初始化权限

superset init
AI 代码解读

//启动superset 的web server,端口号为8088,使用-p参数可以即时绑定当diy端口。

superset runserver
AI 代码解读

7.接下来,如果感兴趣可以实现界面的部分汉化:
(a)使用vim编辑器打开

    anaconda/envs/superset/lib/python3.4/site-packages/superset/目录下的config.py文件,需要改动的地方有两处:

1)找到Setup default language这一行,修改变量BABEL_DEFAULT_LOCALE调整为‘zh',这样界面默认为中文
2)将LANGUAGES字典中zh前面的注释#去掉保存后退出
AI 代码解读

(b)在anaconda/envs/superset/lib/python3.4/site-packages/superset/目录下执行如下命令

mkdir -p translations/zh/LC_MESSAGES
AI 代码解读

(c)进入刚创建的目录中执行如下命令即可:

wget 'https://github.com/apache/incubator-superset/blob/master/superset/translations/zh/LC_MESSAGES/messages.mo'
AI 代码解读

8.打开浏览器输入

http://ip:8088即可访问,输入6步骤中创建的用户名和密码即可进入。
AI 代码解读

9.一个小的测试:
点击数据源,(mysql数据源)
需要使用pip安装pymysql命令如下

pip install pymysql
AI 代码解读

,然后填写数据库相关信息,具体填充内容如下图示例所示。

这里写图片描述

 1)其中mysql是数据库类型,pymysql是驱动程序,表示用pymysql连接mysql数据库,+号不能省略
 2)bymain为mysql数据库的username, ‘:’后面是password,后面。localhost是数据库地址,因为我的是本地环境,所以localhost即可,也可以是127.0.0.13306是端口,一般默认这个。mahout是需要连接的数据库,也是我自己设的名字。后面带参数charset=utf8,表示编码,因为表里面有中文。
 3)点击测试,提示 seems ok表示连接成功!,然后点击保存即可。
 4)然后点击右上角的SQL工具箱,里面的SQL编辑器。左边选择数据库,表后,在右边既可以进行数据sql查询,如下所示。
AI 代码解读

这里写图片描述
接着选择对应维度后,就可以出BI报表图了。效果示例如下:

这里写图片描述

10.更多的功能需要大家去学习,例如kylin+superset, 数据源用redis等等。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
0
0
0
1
分享
相关文章
Android调试终极指南:ADB安装+多设备连接+ANR日志抓取全流程解析,覆盖环境变量配置/多设备调试/ANR日志分析全流程,附Win/Mac/Linux三平台解决方案
ADB(Android Debug Bridge)是安卓开发中的重要工具,用于连接电脑与安卓设备,实现文件传输、应用管理、日志抓取等功能。本文介绍了 ADB 的基本概念、安装配置及常用命令。包括:1) 基本命令如 `adb version` 和 `adb devices`;2) 权限操作如 `adb root` 和 `adb shell`;3) APK 操作如安装、卸载应用;4) 文件传输如 `adb push` 和 `adb pull`;5) 日志记录如 `adb logcat`;6) 系统信息获取如屏幕截图和录屏。通过这些功能,用户可高效调试和管理安卓设备。
Linux命令shuf详解:随机排序与数据分析的得力助手
`shuf`是Linux的命令行工具,用于随机排序和抽样数据。它能对文件或标准输入进行随机处理,适用于数据测试、播放列表和样本选择。主要参数包括:-e处理命令行输入,-i指定数字范围,-n选择行数,-o输出到文件,-r允许重复,-z用NULL分隔。结合其他命令使用能增强其功能。注意输出重定向和随机性的保证。是数据分析的有力助手。
Linux平台Oracle开机自启动设置
【11月更文挑战第8天】在 Linux 平台设置 Oracle 开机自启动有多种方法,本文以 CentOS 为例,介绍了两种常见方法:使用 `rc.local` 文件(较简单但不推荐用于生产环境)和使用 `systemd` 服务(推荐)。具体步骤包括编写启动脚本、赋予执行权限、配置 `rc.local` 或创建 `systemd` 服务单元文件,并设置开机自启动。通过 `systemd` 方式可以更好地与系统启动过程集成,更规范和可靠。
381 2
Linux平台Oracle开机自启动设置
【11月更文挑战第7天】本文介绍了 Linux 系统中服务管理机制,并详细说明了如何在使用 systemd 和 System V 的系统上设置 Oracle 数据库的开机自启动。包括创建服务单元文件、编辑启动脚本、设置开机自启动和启动服务的具体步骤。最后建议重启系统验证设置是否成功。
127 1
快速入门:利用AnalyticDB构建实时数据分析平台
【10月更文挑战第22天】在大数据时代,实时数据分析成为了企业和开发者们关注的焦点。传统的数据仓库和分析工具往往无法满足实时性要求,而AnalyticDB(ADB)作为阿里巴巴推出的一款实时数据仓库服务,凭借其强大的实时处理能力和易用性,成为了众多企业的首选。作为一名数据分析师,我将在本文中分享如何快速入门AnalyticDB,帮助初学者在短时间内掌握使用AnalyticDB进行简单数据分析的能力。
157 2
Linux平台安装MongoDB
10月更文挑战第11天
155 5
|
6月前
|
FFmpeg开发笔记(五十九)Linux编译ijkplayer的Android平台so库
ijkplayer是由B站研发的移动端播放器,基于FFmpeg 3.4,支持Android和iOS。其源码托管于GitHub,截至2024年9月15日,获得了3.24万星标和0.81万分支,尽管已停止更新6年。本文档介绍了如何在Linux环境下编译ijkplayer的so库,以便在较新的开发环境中使用。首先需安装编译工具并调整/tmp分区大小,接着下载并安装Android SDK和NDK,最后下载ijkplayer源码并编译。详细步骤包括环境准备、工具安装及库编译等。更多FFmpeg开发知识可参考相关书籍。
198 0
FFmpeg开发笔记(五十九)Linux编译ijkplayer的Android平台so库
构建高可用的数据分析平台:Dask 集群管理与部署
【8月更文第29天】随着数据量的不断增长,传统的单机数据分析方法已无法满足大规模数据处理的需求。Dask 是一个灵活的并行计算库,它能够帮助开发者轻松地在多核 CPU 或分布式集群上运行 Python 代码。本文将详细介绍如何搭建和管理 Dask 集群,以确保数据分析流程的稳定性和可靠性。
688 3
Linux平台x86_64|aarch64架构RTMP推送|轻量级RTSP服务模块集成说明
支持x64_64架构、aarch64架构(需要glibc-2.21及以上版本的Linux系统, 需要libX11.so.6, 需要GLib–2.0, 需安装 libstdc++.so.6.0.21、GLIBCXX_3.4.21、 CXXABI_1.3.9)。
185 0
Linux平台Unity下RTMP|RTSP低延迟播放器技术实现
本文介绍了在国产操作系统及Linux平台上,利用Unity实现RTMP/RTSP直播播放的方法。通过设置原生播放模块的回调函数,可将解码后的YUV数据传递给Unity进行渲染,实现低延迟播放。此外,还提供了播放器启动、参数配置及停止的相关代码示例,并概述了如何在Unity中更新纹理以显示视频帧。随着国产操作系统的发展,此类跨平台直播解决方案的需求日益增长,为开发者提供了灵活高效的开发方式。
144 6
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等