ggplot2简介


ggplot2 是一个 R 包,专为数据可视化和提供最佳探索性数据分析而设计。它提供了精美、轻松的情节,可以处理诸如绘制图例和表示它们的微小细节。这些图可以迭代创建并在以后进行编辑。该软件包旨在以分层方式工作,首先显示在使用 R 进行探索性数据分析期间收集的原始数据的层,然后添加注释和统计摘要层。

即使是最有经验的 R 用户也需要帮助来创建优雅的图形。这个库是在 R 中创建图形的非凡工具,但即使经过多年几乎每天的使用,我们仍然需要参考我们的备忘单。

这个包在称为“图形语法”的深层语法下工作,它由一组可以通过多种方式创建的独立组件组成。 “图形语法”是使 ggplot2 非常强大的唯一原因,因为 R 开发人员不仅限于在其他包中使用的一组预先指定的图形。语法包括一组简单的核心规则和原则。

2005 年,Wilkinson 创立了或者更确切地说是起源于图形语法的概念来描述包含在所有统计图形之间的深层特征。它专注于主要的层,包括适应嵌入 R 的特性。

“图形语法”与 R 的关系


它告诉用户或开发人员,统计图形用于将数据映射到美学属性,如颜色、形状、相关几何对象(如点、线和条)的大小。该图还可以包含在上述坐标系上绘制的相关数据的各种统计转换。它还包括一个称为“Faceting”的功能,通常用于为上述数据集的不同子集创建相同的图。 R 包括各种内置数据集。这些独立组件的组合完全构成了一个特定的图形。

现在让我们关注可以参考语法创建的不同类型的图:

Data

如果用户想要可视化给定的一组美学映射,它描述了数据中所需的变量如何映射在一起以创建映射的美学属性。

Layers

它由几何元素和所需的统计变换组成。图层包括几何对象、用于短数据的几何图形,它们在点、线、多边形等的帮助下实际代表绘图。最好的演示是对观察结果进行分箱和计数,以创建特定的直方图,以总结特定线性模型的 2D 关系。

Scales

比例尺用于映射数据空间中的值,用于创建值,无论是颜色、大小和形状。它有助于绘制提供逆映射所需的图例或轴,从而可以从提到的图中读取原始数据值。

坐标系

它描述了数据坐标如何一起映射到所提到的图形平面。它还提供读取图形所需的轴和网格线的信息。通常它用作笛卡尔坐标系,包括极坐标和地图投影。

Faceting

它包括有关如何将数据分解为所需子集并将子集显示为数据倍数的规范。这也称为调节或网格化过程。

Theme

它控制更精细的显示点,如字体大小和背景颜色属性。为了创造一个有吸引力的情节,最好考虑参考。

现在,讨论语法没有提供的限制或特性也同样重要:

  • 它缺乏关于应该使用哪些图形或用户有兴趣做的建议。

  • 它不描述交互性,因为它仅包括静态图形的描述。对于动态图形的创建,应应用其他替代解决方案。

使用 ggplot2 创建的简单图形如下:

Graph Created With ggplot2