Crear visualizaciones en R usando ggplot2 puede ser una forma poderosa de explorar y comprender sus datos. Un tipo común de visualización es el gráfico bivariado, que le permite examinar la relación entre dos variables.
En este tutorial, aprenderá cómo producir visualizaciones bivariadas en R usando ggplot2. Este blog se centrará específicamente en las visualizaciones que serían difíciles de realizar en LuckyTemplates pero fáciles de realizar en R.
Tabla de contenido
Descripción general
Tres temas principales serán discutidos en este tutorial. Aprenderá cómo visualizar las distribuciones de una variable por grupo y cómo visualizar correlaciones y relaciones por pares.
Una relación por pares se refiere a la relación entre cada par de variables en un conjunto de datos dado.
Para este tutorial, debe descargar el paquete ggplot2 . Una vez hecho esto, abra un script R en blanco y traiga dos bibliotecas: tidyverse y GGally .

GGally es una extensión de ggplot2. Está diseñado para reducir la complejidad de combinar objetos geométricos con datos transformados.
Las diferentes visualizaciones bivariadas en R
Una visualización bivariada muestra la relación entre dos variables.
Como ejemplo, creemos una visualización que muestre la relación entre la ciudad y la carretera. Debe usar la función ggplot ( ) y luego asignar los datos apropiados.
A continuación, se utiliza la función geom_point() para generar el diagrama de dispersión .

Visualizaciones en R que muestran correlación
La función ggcorr() se utiliza para visualizar la correlación entre variables. Esto generará un mapa de calor con los valores de correlación más bajos a más altos mostrados. Puede mejorar aún más la visualización agregando un argumento que mostrará las etiquetas.

Visualizaciones en R que muestran una relación por pares
Para la gráfica por pares, necesita usar la función ggpairs ( ) .
Dado que el marco de datos de este ejemplo contiene un gran conjunto de datos, primero debe filtrarse para mostrar solo valores numéricos o, de lo contrario, los resultados mostrarán un error.
Para filtrar datos, utilice el operador de canalización y la función select_if ( ) .

En la pestaña Gráficos , puede ver la visualización por pares generada por el código. También puede ver el gráfico y el valor de correlación entre cada variable.
Otra cosa que puede hacer con los diagramas por pares es agregar elementos adicionales para aumentar la visualización. Puede agregar otra variable y cambiar el color de los datos.
En este caso, la columna de la unidad se agrega al código y la función de mapeo estético se usa para cambiar su color.

Cuando ejecute el código, verá que el gráfico muestra gráficos de dispersión y los valores de correlación por unidad. La diagonal también muestra la distribución según cada unidad.

Conclusión
Si desea crear visualizaciones sólidas y respaldadas estadísticamente, como histogramas, diagramas de dispersión y diagramas de caja, se recomienda usar ggplot2 con GGally.
El lenguaje de programación R junto con varios paquetes de visualización como ggplot2 permite a los usuarios crear visualizaciones que muestran la relación y correlación entre variables.
GGally amplía ggplot2 aumentando varias funciones que reducen la complejidad. Si intenta crear visualizaciones bivariadas y multivariadas en LuckyTemplates, resultará ser un desafío. Sin embargo, dentro del lenguaje de programación R, solo necesita escribir una sola línea de código para llegar al gráfico estadístico que necesita.
Mis mejores deseos,
monte george