Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

El paquete ggplot2 es la forma más completa de crear gráficos y diagramas. Las empresas, como el New York Times y The Economist, utilizan mucho ggplot2 para crear sus visualizaciones. Dado que las grandes empresas utilizan esta herramienta, es importante tener una base de conocimientos sobre cómo utilizar ggplot2 para crear visualizaciones como el diagrama de fluctuación.

En este tutorial, aprenderá a crear un diagrama de fluctuación utilizando ggplot2 en . Una vez que comprenda la gramática de los gráficos en ggplot2, podrá encadenar cualquier gráfico o diagrama.

Un diagrama de fluctuación es un tipo de diagrama de dispersión que se utiliza para mostrar la distribución de un conjunto de puntos de datos numéricos. La "inestabilidad" en el nombre del gráfico se refiere a la variación aleatoria que se agrega a la posición de cada símbolo a lo largo de los ejes x e y.

Esta variación ayuda a evitar que los símbolos se superpongan y facilita ver la distribución de los puntos de datos en los casos en que hay una alta densidad de puntos en ciertas áreas del gráfico.

Si tiene un diagrama densamente poblado, un diagrama de fluctuaciones puede hacer que su visualización sea más fácil de entender. También puede usarlo para trazar distribuciones por categoría, que es una alternativa a un diagrama de caja o un histograma .

Tabla de contenido

Creación de un diagrama de fluctuación en R

Para esta demostración, se utiliza el conjunto de datos tidyverse .

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

Primero, cree un diagrama de dispersión usando la función ggplot ( ) . En este caso, el eje x es el año, mientras que el eje y es el conjunto de datos de millas por galón.

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

Cuando ejecuta el código, puede ver que el gráfico muestra puntos que forman una línea recta con respecto al eje y.

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

Use la función geom_jitter ( ) para agregar otra capa al gráfico. Cuando ejecute el código, verá que los puntos en el gráfico cambiaron. Los puntos seguirán cambiando cada vez que ejecute el código.

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

Para evitar que los puntos cambien constantemente, utilice la función set.seed ( ) . Dentro del paréntesis, escriba cualquier número aleatorio. En este caso, es 1234. Después de ejecutar el código, verá que la trama permanece igual incluso si hace clic repetidamente en Ejecutar.

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

Creación de un diagrama de fluctuación con variables categóricas

También puede usar la función geom_jitter ( ) para variables categóricas.

Usando el mismo argumento, cambiemos el eje x a mpg y el eje y al origen. Cuando ejecuta la nueva línea de código, puede ver que, en lugar de mostrar los datos en líneas rectas, se distribuyen aleatoriamente en el gráfico.

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

Esto le ayuda a visualizar las observaciones individuales de cada categoría y cómo varían. En este caso se puede ver el kilometraje típico de un origen versus otro.

Puede agregar color a la trama agregando otro argumento en la función aes ( ) . También puede establecer el tamaño de los puntos en un valor de datos específico en su conjunto de datos.

Creación de un diagrama de fluctuación utilizando Ggplot2 en RStudio

En este ejemplo, el diagrama de fluctuación facilitó la identificación de los orígenes con la mayoría de los automóviles y aquellos que tienen un mejor kilometraje.

Debido al tamaño establecido en el código, la trama parece sobresaturada. Puede cambiar el tamaño o el color de los puntos de datos según sus preferencias o requisitos comerciales.

Conclusión

Un diagrama de fluctuación es una de las formas de aportar una nueva forma de conocimiento a sus visualizaciones. Ayuda a los usuarios a comprender mejor lo que sucede con los datos. Este gráfico es una excelente alternativa al típico histograma o diagrama de caja para trazar distribuciones.

La capacidad de comprender de manera efectiva la estructura subyacente de un conjunto de datos hace que los diagramas de fluctuación sean una herramienta valiosa en varios campos, como las estadísticas, el análisis de datos y el aprendizaje automático. En general, los diagramas de fluctuación proporcionan una representación clara y fácil de entender de la distribución de puntos de datos numéricos, lo que los convierte en una herramienta poderosa para la visualización y el análisis de datos.

Mis mejores deseos,

monte george


Time Intelligence en LuckyTemplates: cómo calcular el número de transacciones realizadas en los últimos N días

Time Intelligence en LuckyTemplates: cómo calcular el número de transacciones realizadas en los últimos N días

Descubra cómo calcular el total de transacciones realizadas en los últimos N días y obtenga información útil utilizando la inteligencia de tiempo en LuckyTemplates.

Cómo evaluar clústeres en sus datos mediante la técnica DAX en LuckyTemplates

Cómo evaluar clústeres en sus datos mediante la técnica DAX en LuckyTemplates

En este tutorial, demuestro cómo mostrar clústeres en sus datos permite extraer información valiosa usando técnicas DAX avanzadas.

¿Cuánto personal tenemos actualmente? Lógica de fechas múltiples en LuckyTemplates usando DAX

¿Cuánto personal tenemos actualmente? Lógica de fechas múltiples en LuckyTemplates usando DAX

En este tutorial, aprenderá a calcular la <strong>población actual del personal</strong> para las relaciones múltiples de la tabla de calendario mediante la función COUNTROWS y FILTER en LuckyTemplates.

Hacer una solicitud HTTP en Power Automate

Hacer una solicitud HTTP en Power Automate

Aprenda a crear una solicitud HTTP con Power Automate y cómo implementar soluciones efectivas para la automatización de tareas.

Programe un flujo de escritorio para que se ejecute en Power Automate

Programe un flujo de escritorio para que se ejecute en Power Automate

En este tutorial, aprenda cómo programar un flujo de escritorio en Power Automate para automatizar tareas en la web y su escritorio.

Power Automate Terminar Control de acción en flujos

Power Automate Terminar Control de acción en flujos

Aprenda a usar correctamente el control Terminar acción de Power Automate que termina las acciones en un flujo si no se cumple alguna de las condiciones.

Power Query: combinar archivos de varias carpetas

Power Query: combinar archivos de varias carpetas

Aprenda a combinar archivos de varias carpetas en su red, escritorio, OneDrive o SharePoint utilizando Power Query.

Tipos de flujo de Power Automate y cuándo usarlos

Tipos de flujo de Power Automate y cuándo usarlos

En este blog, analizamos las similitudes y diferencias entre los tipos de flujo de Power Automate y determinamos cuándo usar cada flujo. Encuentra la mejor opción de automatización.

Conectores de Power Automate: número, texto y fecha y hora

Conectores de Power Automate: número, texto y fecha y hora

Familiarízate con algunos conectores Power Automate integrados que transforman cadenas en otro formato: número, texto y fecha y hora.

Tutorial del analizador VertiPaq: relaciones e integridad referencial

Tutorial del analizador VertiPaq: relaciones e integridad referencial

Este tutorial detallado sobre el analizador VertiPaq en DAX Studio le enseñará cómo usar la pestaña Relaciones para optimizar su DAX y resolver problemas de integridad referencial.