数据分析:构建可视化报表服务

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 摘要:本手册为北京云栖 Workshop《云数据·大计算:快速搭建互联网在线运营分析平台》的《数据分析:构建可视化报表服务》篇而准备。主要阐述如何使用Quick BI制作报表,将前面几个实验处理分析得来的数据进行有效的展现和洞察。

上一步>>数据处理:数据建模与加工

实验背景介绍

本手册为北京云栖 Workshop《云数据·大计算:快速搭建互联网在线运营分析平台》的《数据分析:构建可视化报表服务》篇而准备。主要阐述如何使用Quick BI制作报表,将前面几个实验处理分析得来的数据进行有效的展现和洞察。

实验目标

承接前述实验加工好的数据表rpt_user_trace_log,通过Quick BI完成网站用户分析画像的仪表板。该表包含了:country、province、city、device_brand、use_time、pv等字段信息。见图表示意链接
5
6

  • 在该仪表板中,将展示用户的核心指标、周期变化、用户地区分布、分布和记录。
  • 并能够根据国家的查询条件,动态更新图表数据内容。

实验涉及大数据产品

实验环境准备

必备条件

  • 确保阿里云账号处于登录状态。
  • 开通Quick BI高级版试用,见帮助文档

进入Quick BI

确保阿里云账号处于登录状态。

  • step1:点击进入Quick BI管理控制台。
    _2017_12_18_15_24_47

_2017_12_18_15_24_56

  • step2:进入到产品首页。进入“默认组织”
    1

第一步:连接数据——添加数据源

《数据处理:数据建模与加工》实验将数据导入云数据库RDS后,可以利用Quick BI添加为数据源进行分析和展示。本章节为了大家快速的掌握Quick BI的使用提前将数据给大家拷贝了一份在官方的RDS里,大家只需要配置即可用。

  • step1:选择空间默认空间,点击数据源进入数据源列表页。

[说明] 数据量千万级别,响应速度秒级。Quick BI支持MaxCompute和RDS数据源,这次演示推荐RDS(MySQL)。

  • step2:点新建数据源,选择并点击(RDS)MySQL
    点击MySQL
  • step3:配置 MySQL 数据源,并点击 测试连通性 ,待连通性测试通过后,点击 添加 保存现有配置信息。
    配置MySQL

RDS for MySQL数据源配置信息如下:

  • 显示名称:workshop
  • 数据库地址: rm-bp1z69dodhh85z9qa.mysql.rds.aliyuncs.com
  • 端口:3306
  • 数据库:workshop
  • 用户名:workshop
  • 密码:workshop#2017
  • step4:点击数据源列表页中workshop数据源这行,显示该数据源下的数据表,找到表rpt_user_trace_log,并点击创建数据集按钮生成数据集。并“确定”跳转到数据集页面。
    2

4

第二步:编辑数据集

说明:

  1. 将对表的加工过程固化保存下来以避免重复操作。
  2. 常见加工:维度、度量的切换、修改维度的类型、 增加计算字段、创建层次结构、修改字段的数据类型、更改度量聚合方式、 制作关联模型。
  • step1:进入数据集的列表页,进入“我的数据集”文件夹;点击名称,进入编辑数据集页面。
    3
  • step2:转换字段的维度类型

    • 选择access_date字段->右键->维度类型切换->日期(源数据格式)->yyyyMMdd。如下图所示:
      _2017_12_18_16_14_39
    • 转换包含地理信息的字段的维度类型(一般字段不需要转换)。选择province字段->右键->维度类型切换->地理信息->省。
      _2017_12_18_16_13_25
    • 选择city字段->右键->维度类型切换->地理信息->省/直辖市。如下图所示:
      _2017_12_18_16_13_39
    • 转换成功后,在左侧维度栏中会看到region字段前多一个地理位置图标,如下图所示:
  • step3:新建层系。选择province字段->右键->新建层系结构,

    • _2017_12_18_16_13_48
    • 弹出提示框,点击确定。
    • 然后把 city字段移到province层次结构 的树下,如图所示
      7
  • step4:点击保存,保存数据集。然后点击"返回"进入数据集列表页。

第三步:制作仪表板

与上一节衔接,将分析结果固化为可视化报表。随着数据的更新,报表可视化展现最新数据。我们把这个过程叫制作仪表板。

制作思路:确定内容->确定布局和样式->制作图表->实现动态联动查询。

step1:点击rpt_user_trace_log后面的新建仪表板,进入仪表板编辑页
10

或者点击主导航上的仪表板菜单,点击新建下拉菜单下的新建仪表板按钮,就可以开始创建一个仪表板。

step2:指标卡,从仪表板空间中向空白区拖入2个指标卡,调整布局成一排。

  • 指标卡一:选择数据来源为来自数据集rpt_user_trace_log,选择度量为pv,点击更新
  • 指标卡二:选择数据来源为来自数据集rpt_user_trace_log,选择度量为uv,点击更新
    11

step3:趋势图,将图表区域内的线图拖拽左侧画布,

  • 并配置选择数据来源为来自数据集rpt_user_trace_log,选择维度为device(设备)、度量为pv,点击更新图表, 结果如下:
    业务目的:最近7天的查看趋势

14

step4:色彩地图,点击图表区域内的色彩地图,并选择数据源来源为来自数据集rpt_user_trace_log,选择维度为province(地区)、度量为pv,选择完成后点击更新图表按钮,结果如下:
15

业务目的:查看访问用户的地域分布情况。

step5:向画布中拖入控件区域内的查询控件放在第一行。拖动结束后,设置查询条件对应的字段、作用范围和样式:

step5.1:首先将前面制作好的色彩地图、曲线图的标题依次改为,全国地区分布、最近7天趋势。

step5.2:增加查询条件日期 access_date 和country。接着,点击并设置查询条件对应到哪个字段和作用范围(上述配置的两个控件名称):变化的时候能影响到哪些图表控件。选择access_date到组件两个指标卡最近7天趋势,选择country控制所有的图表

step5.3:然后设置查询条件的显示样式,设置country为枚举类型复选框样式,默认中国。设置access_date 默认*日期-绝对时间,选中日期框为20171213。点击"查询"页面生效。
[注意]鼠标选中查询条件的输入框后,样式设置界面才会出现。

step6:点击保存仪表板,名称为云栖大会workshop
保存仪表板

step7:点击预览仪表板,预览验证。

修改时间日期为20171211,看仪表板的各个区块的图表的数据是否随着查询条件的变化而变化。

第四步:制作数据门户

恭喜各位已经完成了数据采集、处理到展现的链路。更多的关于Quick BI的信息,详见官网Quick BI

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
28天前
|
数据可视化 数据挖掘 Python
python数据分析和可视化【3】体检数据分析和小费数据分析
python数据分析和可视化【3】体检数据分析和小费数据分析
34 0
|
28天前
|
数据可视化 数据挖掘 Python
python数据分析和可视化【1】
python数据分析和可视化【1】
40 0
|
1月前
|
数据采集 数据可视化 数据挖掘
利用Python进行数据分析与可视化
【2月更文挑战第25天】 在当今数据驱动的时代,能够有效地分析和可视化数据变得至关重要。本文将深入探讨如何运用Python语言及其强大的库,包括Pandas、NumPy、Matplotlib和Seaborn,来执行数据处理、分析以及生成直观的图表。我们将通过一个实际案例,从原始数据集的加载开始,逐步展示如何清洗、处理数据,并最终通过可视化手段洞察数据背后的故事。
|
1月前
|
数据采集 数据可视化 数据挖掘
深入浅出:使用Python进行数据分析与可视化
在信息爆炸的时代,数据已成为企业和研究机构不可或缺的宝贵资源。如何从海量数据中提取有价值的信息,是当下技术界面临的重大挑战之一。本文将引导读者深入了解如何利用Python语言,特别是其强大的数据处理库Pandas和可视化库Matplotlib,来进行有效的数据分析与结果呈现。我们将通过一个实际案例,展示从数据清洗到最终数据可视化的整个过程,使读者能够掌握将理论应用于实践的能力,进而在自己的工作和研究中发挥重要作用。
|
2月前
|
搜索推荐 数据可视化 数据挖掘
产品服务数据分析与报告
产品服务数据分析与报告
39 3
|
28天前
|
数据可视化 数据挖掘 BI
python数据分析和可视化【2】鸢尾花数据分析
python数据分析和可视化【2】鸢尾花数据分析
34 0
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
Python技术应用:数据分析与可视化的利器
【2月更文挑战第7天】在当今信息爆炸的时代,数据分析和可视化已经成为各行业的核心竞争力。Python作为一种简洁、高效的编程语言,为数据分析带来了全新的可能性。本文将介绍Python在数据分析和可视化领域的应用,探讨其在实际工作中的重要性和价值。
25 2
|
12天前
|
机器学习/深度学习 数据可视化 数据挖掘
【python】双十一美妆数据分析可视化 [聚类分析/线性回归/支持向量机](代码+报告)【独一无二】
【python】双十一美妆数据分析可视化 [聚类分析/线性回归/支持向量机](代码+报告)【独一无二】
|
12天前
|
机器学习/深度学习 数据可视化 数据挖掘
利用Python进行数据分析与可视化:从入门到精通
本文将介绍如何使用Python语言进行数据分析与可视化,从基础概念到高级技巧一应俱全。通过学习本文,读者将掌握Python在数据处理、分析和可视化方面的核心技能,为实际项目应用打下坚实基础。
|
17天前
|
人工智能 监控 数据可视化
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】