Un gráfico de piruleta, también conocido como gráfico con mancuernas, es una técnica de visualización de datos que combina un gráfico de dispersión y un gráfico de barras para mostrar la distribución de una sola variable numérica. Se utiliza para mostrar los cambios en una sola variable a lo largo del tiempo o en diferentes grupos.
El gráfico consta de un gráfico de dispersión con un solo punto para cada punto de datos, conectado por una línea (o "tallo") a un gráfico de barras. El gráfico de dispersión muestra la distribución de los datos, mientras que el gráfico de barras muestra los cambios en la variable a lo largo del tiempo o entre diferentes grupos.
En este tutorial, aprenderá cómo crear una visualización de diagrama de piruleta utilizando ggplot2 en RStudio .
Tabla de contenido
Creación de un gráfico Lollipop básico
Para nuestro tutorial, usaremos el paquete tidyverse junto con un conjunto de datos de béisbol del paquete Lahman. El objetivo es comparar el número de victorias de cada equipo en la temporada 2020.
Primero, use la función de filtro ( ) para mostrar solo datos dentro del año 2020.

Para estar más familiarizado con los nombres de las columnas en el conjunto de datos, puede usar la función de nombres ( ) .

A continuación, utilice la función ggplot ( ) para crear el gráfico. Dentro de los paréntesis, especifique 'temporada' como conjunto de datos. Los ejes x e y también se establecen en 'W' (ganancias) y 'nombre', respectivamente.
Agregue un signo más ( + ) y luego escriba la función geom_segment ( ) . Esto dibujará una línea recta entre los puntos de parada y de inicio que especifique. Cuando ejecute el código, verá obtener un gráfico de piruleta básico.

Cuando mire la visualización, entenderá fácilmente por qué se llama diagrama de piruleta. Hay una línea dibujada a partir del cero del eje x y el punto de datos está representado por un círculo.
Dar formato a un diagrama de piruleta en R
Una vez que esté satisfecho con el aspecto de su gráfico de piruleta básico, puede agregar cambios de formato para resaltar cierta información en la visualización.
Puede aumentar el tamaño del círculo final y colocarle una etiqueta. Puede especificar el tamaño del círculo y la etiqueta de color según sus preferencias.

Los datos en el diagrama de piruleta también se pueden ordenar alfabética o numéricamente. Para ordenar el gráfico, use la función reordenar ( ) y luego especifique el orden en el que desea que estén los datos.

También puede cambiar el tema de la visualización para modificar el color de fondo usando el argumento función_tema ( ) . Esto es especialmente útil cuando desea importar sus visualizaciones a LuckyTemplates. Personalizar el tema en RStudio ayudará a que la trama se mezcle con el informe en LuckyTemplates.

Conclusión
La creación de un diagrama de piruleta en RStudio es un proceso relativamente simple que le permite mostrar y analizar de manera efectiva la distribución de una sola variable numérica. También tiene la opción de personalizar la trama cambiando los colores, las etiquetas y otros elementos. Una vez que haya creado el gráfico, puede usarlo para identificar patrones y tendencias en sus datos y comparar diferentes grupos o períodos de tiempo.
En general, los diagramas de piruleta son una técnica de visualización de datos útil que puede proporcionar una representación clara y fácil de entender de sus datos, lo que la convierte en una herramienta valiosa para el análisis y la presentación de datos.
Mis mejores deseos,
monte george