2 ggplot2
¡Empecemos por lo básico! El paquete ggplot2
se basa en la Gramática de los Gráficos (GG), que es un marco para la visualización de datos que disecciona cada componente de un gráfico en componentes individuales, creando capas distintas. Utilizando el sistema GG, podemos construir gráficos paso a paso para obtener resultados flexibles y personalizables.
Las capas GG tienen nombres específicos que verás a lo largo de esta seccion:
Para hacer un ggplot, las capas de datos y mapas son requisitos básicos, mientras que las otras capas son para personalización adicional. Las capas que «no son necesarias» siguen siendo importantes, pero podrás generar un gráfico básico sin ellas.
2.1 Desglose de las capas comunes
A continuación se presenta un desglose de cada una de las capas de la GG y los argumentos comunes de cada una de ellas que pueden servir de referencia:
- Datos:
sus datos
, en formatotidy
odataframe
, proporcionarán los ingredientes para su trazado- utilice las técnicas
dplyr
para preparar los datos para un formato de trazado óptimo - por lo general, esto significa que debe tener una fila por cada observación que desea trazar
- Estética (Aesthetics / aes), para hacer visibles los datos
x
,y
: variable a lo largo de los ejes x e y.colour
: color de las variables según los datos.fill
: color interior de la zona o relleno.group
: a qué grupo pertenece una geom.shape
: la figura utilizada para trazar un punto.linetype
: tipo de línea utilizada (sólida, discontinua, etc.).size
: escala de tamaño para una dimensión extraalpha
: transparencia del objeto geométrico
- Objetos geométricos (geoms - determina el tipo de trazado)
geom_point()
: gráfico de dispersióngeom_line()
: líneas que conectan puntos aumentando el valor de xgeom_path()
: líneas que conectan puntos en secuencia de aparicióngeom_boxplot()
: gráfico de caja y bigotes para variables categóricasgeom_bar()
: gráficos de barras para el eje x categóricogeom_histogram()
: histograma para eje x continuogeom_violin()
: núcleo de distribución de la dispersión de datosgeom_smooth()
: línea de función basada en datos
- Facetas:
facet_wrap()
ofacet_grid()
para múltiplos pequeños
- Estadísticas:
- similar a geoms, pero computada
- muestran medias, recuentos y otros resúmenes estadísticos de los datos
- Coordenadas - ajuste de datos en una página
coord_cartesian
para establecer límitescoord_polar
para gráficos circularescoord_map
para diferentes proyecciones cartográficas
- Temas:
- parámetros visuales generales
- fuentes, colores, formas, contornos
2.2 Cheatsheet
Más información en en el Workshop 3: Introduction to data visualisation with ggplot2
2.3 Ejercicios
Te invitamos a que corras el ejercicio propuesto en el script ggplo2_R_Ladies_Morelia_.R por Fernanda Miron.