Statistical transformations 统计转换

2024-03-17 08:48

本文主要是介绍Statistical transformations 统计转换,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

下图显示了钻石数据集中的钻石总数,按切工分组。钻石数据集来自 ggplot2,包含大约 54,000 颗钻石的信息,包括每颗钻石的价格、克拉、颜色、净度和切工。该图表显示,与低质量切割相比,高质量切割的钻石更多。

ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut))

在 x 轴上,图表显示切工,这是钻石的一个变量。 在 y 轴上,它显示计数,但计数不是钻石中的变量! 计数从何而来? 许多图表(如散点图)绘制数据集的原始值。 其他图形,如条形图,计算要绘制的新值:

  • 条形图、直方图和频率多边形对您的数据进行分箱,然后绘制分箱计数,即落在每个分箱中的点数。
  • 平滑器将模型拟合到您的数据,然后根据模型绘制预测。
  • boxplots 计算分布的可靠摘要,然后显示一个特殊格式的框。

用于计算图形新值的算法称为 stat,是统计变换的缩写。 下图描述了这个过程如何与 geom_bar() 一起工作。

您可以通过检查 stat 参数的默认值来了解 geom 使用的统计信息。 例如,?geom_bar 显示 stat 的默认值是“count”,这意味着 geom_bar() 使用 stat_count()。 stat_count() 与 geom_bar() 记录在同一页面上,如果向下滚动,您可以找到名为“计算变量”的部分。 这描述了它如何计算两个新变量:count 和 prop。 您通常可以交替使用 geoms 和 stats。 例如,您可以使用 stat_count() 而不是 geom_bar() 重新创建之前的图:

ggplot(data = diamonds) + stat_count(mapping = aes(x = cut))

 

在下面的代码中,我将 geom_bar() 的 stat 从 count(默认)更改为 identity。 这让我可以将条形的高度映射到 y 的原始值.

demo <- tribble(~cut,         ~freq,"Fair",       1610,"Good",       4906,"Very Good",  12082,"Premium",    13791,"Ideal",      21551
)ggplot(data = demo) +geom_bar(mapping = aes(x = cut, y = freq), stat = "identity")

例如,您可能想要显示比例条形图,而不是计数:

 

ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut, y = stat(prop), group = 1))

 

 

 例如,您可以使用 stat_summary() 来汇总每个唯一 x 值的 y 值,以引起对您正在计算的摘要的注意:

ggplot(data = diamonds) + stat_summary(mapping = aes(x = cut, y = depth),fun.min = min,fun.max = max,fun = median)

 

ggplot2 提供超过 20 个统计数据供您使用。 每个 stat 都是一个函数,因此您可以通过通常的方式获得帮助,例如 ?stat_bin。 要查看完整的统计信息列表,请尝试 ggplot2 备忘单。 

 

 

 

这篇关于Statistical transformations 统计转换的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/818445

相关文章

Java controller接口出入参时间序列化转换操作方法(两种)

《Javacontroller接口出入参时间序列化转换操作方法(两种)》:本文主要介绍Javacontroller接口出入参时间序列化转换操作方法,本文给大家列举两种简单方法,感兴趣的朋友一起看... 目录方式一、使用注解方式二、统一配置场景:在controller编写的接口,在前后端交互过程中一般都会涉及

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

Java对象转换的实现方式汇总

《Java对象转换的实现方式汇总》:本文主要介绍Java对象转换的多种实现方式,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Java对象转换的多种实现方式1. 手动映射(Manual Mapping)2. Builder模式3. 工具类辅助映

python实现svg图片转换为png和gif

《python实现svg图片转换为png和gif》这篇文章主要为大家详细介绍了python如何实现将svg图片格式转换为png和gif,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录python实现svg图片转换为png和gifpython实现图片格式之间的相互转换延展:基于Py

C#实现将Excel表格转换为图片(JPG/ PNG)

《C#实现将Excel表格转换为图片(JPG/PNG)》Excel表格可能会因为不同设备或字体缺失等问题,导致格式错乱或数据显示异常,转换为图片后,能确保数据的排版等保持一致,下面我们看看如何使用C... 目录通过C# 转换Excel工作表到图片通过C# 转换指定单元格区域到图片知识扩展C# 将 Excel

C++使用printf语句实现进制转换的示例代码

《C++使用printf语句实现进制转换的示例代码》在C语言中,printf函数可以直接实现部分进制转换功能,通过格式说明符(formatspecifier)快速输出不同进制的数值,下面给大家分享C+... 目录一、printf 原生支持的进制转换1. 十进制、八进制、十六进制转换2. 显示进制前缀3. 指

使用Python开发一个带EPUB转换功能的Markdown编辑器

《使用Python开发一个带EPUB转换功能的Markdown编辑器》Markdown因其简单易用和强大的格式支持,成为了写作者、开发者及内容创作者的首选格式,本文将通过Python开发一个Markd... 目录应用概览代码结构与核心组件1. 初始化与布局 (__init__)2. 工具栏 (setup_t

Java中Date、LocalDate、LocalDateTime、LocalTime、时间戳之间的相互转换代码

《Java中Date、LocalDate、LocalDateTime、LocalTime、时间戳之间的相互转换代码》:本文主要介绍Java中日期时间转换的多种方法,包括将Date转换为LocalD... 目录一、Date转LocalDateTime二、Date转LocalDate三、LocalDateTim

Mysql如何将数据按照年月分组的统计

《Mysql如何将数据按照年月分组的统计》:本文主要介绍Mysql如何将数据按照年月分组的统计方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql将数据按照年月分组的统计要的效果方案总结Mysql将数据按照年月分组的统计要的效果方案① 使用 DA

Python实现AVIF图片与其他图片格式间的批量转换

《Python实现AVIF图片与其他图片格式间的批量转换》这篇文章主要为大家详细介绍了如何使用Pillow库实现AVIF与其他格式的相互转换,即将AVIF转换为常见的格式,比如JPG或PNG,需要的小... 目录环境配置1.将单个 AVIF 图片转换为 JPG 和 PNG2.批量转换目录下所有 AVIF 图