Plotly – 箱线图小提琴图和等高线图
Plotly – 箱线图小提琴图和等高线图
本章重点详细了解各种绘图,包括箱形图、小提琴图、等高线图和箭袋图。最初,我们将从箱线图开始。
箱形图
箱线图显示一组数据的摘要,其中包含最小值、第一四分位数、中位数、第三四分位数和最大值。在箱线图中,我们从第一个四分位数到第三个四分位数绘制一个方框。一条垂直线穿过中间的盒子。从表示上下四分位数之外的可变性的框垂直延伸的线称为须线。因此,箱线图也称为箱线图。胡须从每个四分位数到最小值或最大值。
要绘制箱形图,我们必须使用go.Box()函数。数据系列可以分配给 x 或 y 参数。因此,箱线图将水平或垂直绘制。在下面的示例中,某公司在其各个分支机构的销售数据被转换为水平箱线图。它显示了最小值和最大值的中位数。
trace1 = go.Box(y = [1140,1460,489,594,502,508,370,200]) data = [trace1] fig = go.Figure(data) iplot(fig)
相同的输出如下 –
所述go.Box()函数可以给出各种其它参数来控制箱线图的外观和行为。其中之一是 boxmean 参数。
该boxmean参数默认设置为true。因此,框的基础分布的平均值被绘制为框内的虚线。如果设置为sd,也会绘制分布的标准差。
该boxpoints参数的缺省设置为“异常值”。仅显示了位于晶须之外的样本点。如果是“疑似异常值”,则显示异常值点,并且突出显示小于 4″Q1-3″Q3 或大于 4″Q3-3″Q1 的点。如果为“False”,则仅显示框而没有样本点。
在以下示例中,框线是用标准差和异常点绘制的。
trc = go.Box( y = [ 0.75, 5.25, 5.5, 6, 6.2, 6.6, 6.80, 7.0, 7.2, 7.5, 7.5, 7.75, 8.15, 8.15, 8.65, 8.93, 9.2, 9.5, 10, 10.25, 11.5, 12, 16, 20.90, 22.3, 23.25 ], boxpoints = 'suspectedoutliers', boxmean = 'sd' ) data = [trc] fig = go.Figure(data) iplot(fig)
相同的输出如下所述 –
小提琴情节
小提琴图类似于箱线图,不同之处在于它们还显示了数据在不同值下的概率密度。小提琴图将包括数据中位数的标记和指示四分位距的框,与标准箱线图一样。叠加在此箱线图上的是核密度估计。与箱线图一样,小提琴图用于表示不同“类别”之间的变量分布(或样本分布)的比较。
小提琴图比普通箱线图提供更多信息。事实上,箱线图仅显示汇总统计数据,例如均值/中位数和四分位距,而小提琴图则显示了数据的完整分布。
小提琴跟踪对象由graph_objects模块中的go.Violin()函数返回。为了显示底层箱线图,boxplot_visible属性设置为 True。同样,通过将meanline_visible属性设置为 true,小提琴内会显示一条与样本均值相对应的线。
以下示例演示了如何使用 plotly 的功能显示小提琴图。
import numpy as np np.random.seed(10) c1 = np.random.normal(100, 10, 200) c2 = np.random.normal(80, 30, 200) trace1 = go.Violin(y = c1, meanline_visible = True) trace2 = go.Violin(y = c2, box_visible = True) data = [trace1, trace2] fig = go.Figure(data = data) iplot(fig)
输出如下 –
等高线图
二维等高线图显示了一个二维数字阵列z的轮廓线,即,内插的行isovalues z与。两个变量的函数的等高线是一条曲线,沿着该曲线该函数具有恒定值,因此该曲线连接等值的点。
如果您想查看某个值 Z 如何作为两个输入X和Y的函数而变化,使得Z = f(X,Y) ,则使用等高线图是合适的。两个变量的函数的等高线或等值线是函数沿其具有恒定值的曲线。
自变量 x 和 y 通常被限制在称为 meshgrid 的规则网格中。numpy.meshgrid 从 x 值数组和 y 值数组中创建一个矩形网格。
让我们首先使用Numpy 库中的linspace()函数为 x、y 和 z 创建数据值。我们从 x 和 y 值创建一个网格,并获得由x2+y2 的平方根组成的 z 数组
我们在graph_objects模块中有go.Contour()函数,它接受 x、y和z属性。以下代码片段显示了如上计算的 x、y和z值的等高线图。
import numpy as np xlist = np.linspace(-3.0, 3.0, 100) ylist = np.linspace(-3.0, 3.0, 100) X, Y = np.meshgrid(xlist, ylist) Z = np.sqrt(X**2 + Y**2) trace = go.Contour(x = xlist, y = ylist, z = Z) data = [trace] fig = go.Figure(data) iplot(fig)
输出如下 –
可以通过以下一个或多个参数自定义等高线图 –
-
Transpose (boolean) – 转置 z 数据。
如果xtype(或ytype)等于“array”,则 x/y 坐标由“x”/“y”给出。如果“缩放”,x 坐标由“x0”和“ dx ”给出。
-
所述connectgaps参数确定z数据是否间隙填充。
-
ncontours参数的默认值是 15。轮廓的实际数量将被自动选择小于或等于 `ncontours` 的值。仅当 `autocontour` 为“True”时有效。
等高线类型默认为:“ levels ”,因此数据表示为显示多个级别的等高线图。如果为constrain,则数据表示为约束,其中无效区域按操作和值参数指定的阴影显示。
showlines – 确定是否绘制轮廓线。
zauto默认为True并确定是否根据输入数据(此处为“ z ” )或在“ zmin ”和“ zmax ”中设置的边界计算颜色域。当“ zmin ”和“ zmin ”时,默认为“ False ” `zmax` 由用户设置。
箭袋图
箭袋图也称为速度图。它将速度矢量显示为在点 (x,y) 处具有分量 ( u,v ) 的箭头。为了绘制 Quiver 图,我们将使用Plotly中的figure_factory模块中定义的create_quiver()函数。
Plotly 的 Python API 包含一个图形工厂模块,该模块包含许多包装函数,这些函数可以创建尚未包含在Plotly的开源图形库 plotly.js 中的独特图表类型。
create_quiver() 函数接受以下参数 –
-
x – 箭头位置的 x 坐标
-
y – y 箭头位置的坐标
-
u − x 箭头向量的分量
-
v − y 箭头向量的分量
-
scale – 缩放箭头的大小
-
arrow_scale – 箭头的长度。
-
角度– 箭头的角度。
以下代码在 Jupyter 笔记本中呈现一个简单的箭袋图 –
import plotly.figure_factory as ff import numpy as np x,y = np.meshgrid(np.arange(-2, 2, .2), np.arange(-2, 2, .25)) z = x*np.exp(-x**2 - y**2) v, u = np.gradient(z, .2, .2) # Create quiver figure fig = ff.create_quiver(x, y, u, v, scale = .25, arrow_scale = .4, name = 'quiver', line = dict(width = 1)) iplot(fig)
代码的输出如下 –