《Python数据可视化编程实战》——5.3 创建3D直方图

简介:

本节书摘来异步社区《Python数据可视化编程实战》一书中的第5章,第5.3节,作者:【爱尔兰】Igor Milovanović,更多章节内容可以访问云栖社区“异步社区”公众号查看。

5.3 创建3D直方图

Python数据可视化编程实战
像3D柱状图一样,我们可能想创建3D直方图。3D直方图可以用来很容易地识别3个独立变量之间的相关性。可以用它们来从图像中提取信息,其中第三个维度可以是所分析的图像的(x, y)空间通道的强度。

本节将学习如何创建3D直方图。

5.3.1 准备工作

回顾一下,直方图表示的是一些值在特定列(通常叫做“bin”)中的发生率。那么,三维直方图表示的是在一个网格中的发生率。网格是矩形的,表示的是在两列中关于两个变量的发生率。

5.3.2 操作步骤

在这个计算过程中,我们将进行如下操作。

1.使用Numpy,因为其拥有计算两个变量的直方图的函数。

2.用正态分布函数生成x和y,但是给它们提供不同的参数,以便能区分结果直方图的相互关系。

3.用相同的数据集合绘制散点图,展示散点图和3D直方图显示上的差异。

下面是实现上述步骤的代码。

import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl

from mpl_toolkits.mplot3d import Axes3D

mpl.rcParams['font.size'] = 10

samples = 25

x = np.random.normal(5, 1, samples)
y = np.random.normal(3, .5, samples)

fig = plt.figure()
ax = fig.add_subplot(211, projection='3d')

# compute two-dimensional histogram
hist, xedges, yedges = np.histogram2d(x, y, bins=10)

# compute location of the x,y bar positions
elements = (len(xedges) - 1) * (len(yedges) - 1)
xpos, ypos = np.meshgrid(xedges[:-1]+.25, yedges[:-1]+.25)

xpos = xpos.flatten()
ypos = ypos.flatten()
zpos = np.zeros(elements)

# make every bar the same width in base
dx = .1 * np.ones_like(zpos)
dy = dx.copy()

# this defines the height of the bar
dz = hist.flatten()

ax.bar3d(xpos, ypos, zpos, dx, dy, dz, color='b', alpha=0.4)
ax.set_xlabel('X Axis')
ax.set_ylabel('Y Axis')
ax.set_zlabel('Z Axis')

# plot the same x,y correlation in scatter plot
# for comparison
ax2 = fig.add_subplot(212)
ax2.scatter(x, y)
ax2.set_xlabel('X Axis')
ax2.set_ylabel('Y Axis') 

plt.show()

上述代码生成如图5-3所示的图形。

f8d4a5ff54f8763fef6c462c848387c30717b659

5.3.3 工作原理

我们用np.histogram2d生成了一个直方图,该方法返回了直方图(hist)、x bin边界和y bin边界。

bar3d函数需要x, y空间的坐标,因此需要计算出一般的矩阵坐标,对此我们使用np.meshgrid函数把x和y位置的向量合并到2D空间网格中(矩阵)。我们可以使用它在xy平面位置上绘制矩形条。

变量dx和dy表示每一个矩形条底部的宽度,我们想把它设置为常数,因此我们为xy平面的每一个位置给定的值为0.1 个点的宽度。

z轴上的值(dz)实际上是计算机直方图(在变量hist中),它表示在一个特定的bin中一般的x和y样本的个数。

接下来在散点图(图5-3)中显示了一个2D坐标轴,也呈现了两组相似但起始参数不同的分布间的相互关系。

有时候,3D给予我们更多的信息,并以一个更好的方式让我们来理解数据所包含的内容。然而在更多情况下,3D可视化比2D更加让人感到迷惑,所以在舍弃2D选择3D之前最好慎重考虑。

相关文章
|
17天前
|
数据采集 JSON 数据可视化
【python】python懂车帝数据可视化(代码+报告)
【python】python懂车帝数据可视化(代码+报告)
|
1天前
|
数据可视化 数据挖掘 定位技术
Python 基于 Matplotlib 实现数据可视化(二)
Python 基于 Matplotlib 实现数据可视化(二)
12 0
|
3天前
|
数据可视化 算法 API
Python数据可视化-seaborn Iris鸢尾花数据
Python数据可视化-seaborn Iris鸢尾花数据
11 0
|
9天前
|
算法 Serverless 计算机视觉
opencv 直方图处理(python)
opencv 直方图处理(python)
|
21天前
|
机器学习/深度学习 人工智能 数据可视化
基于Python的数据可视化技术在大数据分析中的应用
传统的大数据分析往往注重数据处理和计算,然而数据可视化作为一种重要的技术手段,在大数据分析中扮演着至关重要的角色。本文将介绍如何利用Python语言中丰富的数据可视化工具,结合大数据分析,实现更直观、高效的数据展示与分析。
|
8天前
|
安全 Java 数据处理
Python网络编程基础(Socket编程)多线程/多进程服务器编程
【4月更文挑战第11天】在网络编程中,随着客户端数量的增加,服务器的处理能力成为了一个重要的考量因素。为了处理多个客户端的并发请求,我们通常需要采用多线程或多进程的方式。在本章中,我们将探讨多线程/多进程服务器编程的概念,并通过一个多线程服务器的示例来演示其实现。
|
8天前
|
程序员 开发者 Python
Python网络编程基础(Socket编程) 错误处理和异常处理的最佳实践
【4月更文挑战第11天】在网络编程中,错误处理和异常管理不仅是为了程序的健壮性,也是为了提供清晰的用户反馈以及优雅的故障恢复。在前面的章节中,我们讨论了如何使用`try-except`语句来处理网络错误。现在,我们将深入探讨错误处理和异常处理的最佳实践。
|
12天前
|
缓存 监控 Python
解密Python中的装饰器:优雅而强大的编程利器
Python中的装饰器是一种强大而又优雅的编程工具,它能够在不改变原有代码结构的情况下,为函数或类添加新的功能和行为。本文将深入解析Python装饰器的原理、用法和实际应用,帮助读者更好地理解和利用这一技术,提升代码的可维护性和可扩展性。
|
1天前
|
安全 数据处理 开发者
《Python 简易速速上手小册》第7章:高级 Python 编程(2024 最新版)
《Python 简易速速上手小册》第7章:高级 Python 编程(2024 最新版)
12 1