ggplot2 – 散点图和抖动图
ggplot2 – 散点图和抖动图
散点图类似于通常用于绘图的折线图。散点图显示一个变量与另一个变量的相关程度。变量之间的关系称为相关性,通常用于统计方法。我们将使用名为“Iris”的相同数据集,其中包含每个变量之间的许多变化。这是著名的数据集,它给出了来自 3 种鸢尾花中的每一种的 50 朵花的萼片长度和宽度以及花瓣长度和宽度的厘米测量值。该物种被称为 Iris setosa、versicolor 和 virginica。
创建基本散点图
使用“ggplot2”包创建散点图涉及以下步骤 –
为了创建一个基本的散点图,执行以下命令 –
> # Basic Scatter Plot > ggplot(iris, aes(Sepal.Length, Petal.Length)) + + geom_point()
添加属性
我们可以使用 geom_point() 函数中名为 shape 的属性来更改点的形状。
> # Change the shape of points > ggplot(iris, aes(Sepal.Length, Petal.Length)) + + geom_point(shape=1)
我们可以为添加在所需散点图中的点添加颜色。
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) + + geom_point(shape=1)
在这个例子中,我们根据传说中提到的物种创建了颜色。这三个物种在上述地块中是独一无二的。
现在我们将专注于建立变量之间的关系。
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) + + geom_point(shape=1) + + geom_smooth(method=lm)
geom_smooth函数有助于重叠模式和创建所需变量的模式。
属性方法“lm”提到了需要开发的回归线。
> # Add a regression line > ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) + + geom_point(shape=1) + + geom_smooth(method=lm)
我们还可以使用下面提到的语法添加一条没有阴影置信区域的回归线 –
># Add a regression line but no shaded confidence region > ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) + + geom_point(shape=1) + + geom_smooth(method=lm, se=FALSE)
阴影区域代表置信区域以外的事物。
抖动图
抖动图包括可以描绘散点图的特殊效果。抖动只不过是分配给点以将它们分开的随机值,如下所述 –
> ggplot(mpg, aes(cyl, hwy)) + + geom_point() + + geom_jitter(aes(colour = class))