R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象

本文主要是介绍R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

设定、映射、分组、匹配图形属性和图形对象

  • 设定和映射
  • 分组
    • 多个分组与单个图形属性
    • 不同图层上的不同分组
      • 给Oxboys数据添加光滑曲线(`smooth`)
    • 修改默认分组(`group`)
  • 匹配图形属性和图形对象
    • 用线性插值法做颜色渐变线条
    • fill构造叠加条形图

设定和映射

除了可以将一个图形属性映射到一个变量,你也可以在图层的参数里将其设定为一个单一值(例如,colour="red")。图形属性可以根据观测的不同而变化,但是参数则不行。下面的例子用图层里的colour参数设定了点的颜色:

p <- ggplot(mtcars, aes(mpg, wt))
p + geom_point(colour = "darkblue")

在这里插入图片描述

注意这里将颜色映射到’darkblue’与上面将颜色设定给’darkblue’的区别

p + geom_point(aes(colour = "darkblue"))

在这里插入图片描述

将颜色设定为'darkblue'(上)与将颜色映射到'darkblue'(下)的区别。

当颜色映射到'darkblue'时,'darkblue'将被看作一个普通的字符串,使用默认的颜色标度进行标度转换,结果得到了粉红色的点和图例。

分组

多个分组与单个图形属性

很多时候,我们都想将数据分成若干组,并用相同的方式对每个组进行渲染。当从总体上来查看数据时,我们通常希望区分每个个体而不是识别他们。这在含有多个个体的纵向数据中是很常见的,而这类图形也常被称为“细面图”。

下面的第一幅图是一个时间序列图,每条线代表一个男孩。通过这个图你可以看到每个男孩的成长轨迹,但是不能识别哪个男孩是哪条轨迹。生成这个图的代码是:

data(Oxboys, package = "nlme")ggplot(Oxboys, aes(age, height, group = Subject)) + geom_line()
#或
qplot(age, height, data = Oxboys, group = Subject, geom = "line")

在这里插入图片描述
正确分组时(分组变量group =Subject)每个个体的折线图(上)。错误的分组时连接所有观测点的折线图(下)。此处省略了分组图形属性,效果等同于group = 1

qplot(age, height, data = Oxboys, geom = "line")

在这里插入图片描述

不同图层上的不同分组

给Oxboys数据添加光滑曲线(smooth)

上图用了和折线图同样的分组变量,得到了每个男孩的拟合直线。下图在平滑层里用了aes(group = 1),得到了所有男孩的拟合直线。

geom_smooth(aes(group = Subject), method = "lm", se = F)qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(method = "lm", se = F)

在这里插入图片描述

p + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)

在这里插入图片描述

修改默认分组(group)

如果想用箱线图来查看每个时期的身高分布,默认的分组是正确的(上图)。

如果想用geom_line()添加每个男孩的轨迹,就需要在新图层里设定 aes(group = Subject)(下图)。

qplot(Occasion, height, data = Oxboys, geom = "boxplot")

在这里插入图片描述

qplot(Occasion, height, data = Oxboys, geom = "boxplot") + geom_line(aes(group = Subject), colour = "#3366FF")

在这里插入图片描述

boysbox <- ggplot(Oxboys, aes(Occasion, height)) + geom_boxplot()
boysbox + geom_line(aes(group = Subject), colour = "#3366FF")

匹配图形属性和图形对象

群组几何对象另一重要议题是,如何将个体的图形属性映射给整体的图形属性。对于个体几何对象而言这不是个问题,因为每一条观测都被一个单一的图形元素所表示。然而,高密度数据将会使得区别单个的点变得困难(或者不可能),这也意味着如果单个点几何对象变成一个群组几何对象,就变成了一大团点。

线条和路径遵循差一原则:观测点比线段数目多一,第一条线段将使用第一条观测的图形属性,第二条线段将使用第二条观测的图形属性,依次类推。这意味着最后一条观测的图形属性将不会被用到,如下图所示。路径和线条的另一个限制是每个个体的线条类型必须是一个常数,因为R不能绘制不同线条类型相连接的线条。

对于线条和路径,线段的图形属性是由起始点的图形属性决定的。

如果颜色是离散的(上图),在相邻的颜色间插入其他颜色是没有任何意义的。

如果颜色是连续的(下图),可以在相邻的颜色间进行插补,但默认条件下R不会这样做。

df <- data.frame(x = 1:3, y = 1:3, colour = c(1, 3, 5))
qplot(x, y, data = df, colour = factor(colour), size = I(5)) + geom_line(aes(group = 1), size = 2)

在这里插入图片描述

qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(size = 2)

在这里插入图片描述

用线性插值法做颜色渐变线条

xgrid <- with(df, seq(min(x), max(x), length = 50))
interp <- data.frame(x = xgrid, y = approx(df$x, df$y, xout = xgrid)$y, colour = approx(df$x, df$colour, xout = xgrid)$y)
qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(data = interp, size = 2)

在这里插入图片描述

fill构造叠加条形图

对于其他的群组几何对象,如多边形,只有当所有个体的图形属性都相同时,该图形属性才会被使用,否则将使用默认值。这适用于fill参数,因为它是整体对象的一个性质:考虑给多边形边界上的点填充不同的色没有任何意义。
当图形属性映射到连续型变量时,这类问题经常会被涉及。因为正如上所述,当映射对象是离散型的变量时,它将默认地把群组几何对象分解成更小的块。这对条形图和面积图的绘制非常有效,因为将每小块堆积起来就可得到和原来未分组前一样形状的图形,如下图所示。

一个条形图(上)按组分解后得到的叠加条形图(下),两者轮廓相同。

qplot(color, data = diamonds)
qplot(color, data = diamonds, fill = cut)

在这里插入图片描述
在这里插入图片描述

这篇关于R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/769320

相关文章

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

如何合理管控Java语言的异常

《如何合理管控Java语言的异常》:本文主要介绍如何合理管控Java语言的异常问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、Thorwable类3、Error4、Exception类4.1、检查异常4.2、运行时异常5、处理方式5.1. 捕获异常

C语言中的常见进制转换详解(从二进制到十六进制)

《C语言中的常见进制转换详解(从二进制到十六进制)》进制转换是计算机编程中的一个常见任务,特别是在处理低级别的数据操作时,C语言作为一门底层编程语言,在进制转换方面提供了灵活的操作方式,今天,我们将深... 目录1、进制基础2、C语言中的进制转换2.1 从十进制转换为其他进制十进制转二进制十进制转八进制十进

Java如何根据文件名前缀自动分组图片文件

《Java如何根据文件名前缀自动分组图片文件》一大堆文件(比如图片)堆在一个目录下,它们的命名规则遵循一定的格式,混在一起很难管理,所以本文小编就和大家介绍一下如何使用Java根据文件名前缀自动分组图... 目录需求背景分析思路实现代码输出结果知识扩展需求一大堆文件(比如图片)堆在一个目录下,它们的命名规

C++类和对象之初始化列表的使用方式

《C++类和对象之初始化列表的使用方式》:本文主要介绍C++类和对象之初始化列表的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C++初始化列表详解:性能优化与正确实践什么是初始化列表?初始化列表的三大核心作用1. 性能优化:避免不必要的赋值操作2. 强

$在R语言中的作用示例小结

《$在R语言中的作用示例小结》在R语言中,$是一个非常重要的操作符,主要用于访问对象的成员或组件,它的用途非常广泛,不仅限于数据框(dataframe),还可以用于列表(list)、环境(enviro... 目录1. 访问数据框(data frame)中的列2. 访问列表(list)中的元素3. 访问jav

Git可视化管理工具(SourceTree)使用操作大全经典

《Git可视化管理工具(SourceTree)使用操作大全经典》本文详细介绍了SourceTree作为Git可视化管理工具的常用操作,包括连接远程仓库、添加SSH密钥、克隆仓库、设置默认项目目录、代码... 目录前言:连接Gitee or github,获取代码:在SourceTree中添加SSH密钥:Cl

Pandas中统计汇总可视化函数plot()的使用

《Pandas中统计汇总可视化函数plot()的使用》Pandas提供了许多强大的数据处理和分析功能,其中plot()函数就是其可视化功能的一个重要组成部分,本文主要介绍了Pandas中统计汇总可视化... 目录一、plot()函数简介二、plot()函数的基本用法三、plot()函数的参数详解四、使用pl

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav

MySQL中的分组和多表连接详解

《MySQL中的分组和多表连接详解》:本文主要介绍MySQL中的分组和多表连接的相关操作,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录mysql中的分组和多表连接一、MySQL的分组(group javascriptby )二、多表连接(表连接会产生大量的数据垃圾)MySQL中的