Qué es uno mismo en Python: ejemplos del mundo real
Qué es uno mismo en Python: ejemplos del mundo real
En este tutorial, aprenderá a crear una visualización de diagrama de dispersión mediante un script R. Esto se basa en un informe enviado para . Puedes ver el video completo de este tutorial en la parte inferior de este blog.
Tabla de contenido
¿Qué es el diagrama de dispersión?
Un gráfico de dispersión es un tipo de visualización de datos que se utiliza para mostrar la relación entre dos variables continuas. Es un gráfico donde cada punto de datos está representado por un punto, y la posición del punto en los ejes horizontal y vertical corresponde a los valores de las dos variables.
Los diagramas de dispersión son herramientas útiles para identificar patrones y tendencias en los datos. Agregar este objeto visual a sus informes de LuckyTemplates agregará más información a los datos que está presentando. Y al final de este tutorial, podrá crear un diagrama de dispersión R que se vea así:
Esta discusión se divide en cuatro pasos. Primero aprenderá a crear un diagrama de dispersión básico. Luego, aplicará una línea suave para mostrar la tendencia de los datos en el gráfico. Los pasos tercero y cuarto se centran principalmente en temas y cambios de formato que puede aplicar al gráfico de dispersión.
El conjunto de datos utilizado en este ejemplo es una tabla que contiene el nombre del cliente, la duración, las ganancias y la tarifa por hora.
Cree el gráfico de dispersión básico en el objeto visual R Script
Abra su .
Para comenzar, debe tener tres paquetes instalados en su programa RStudio , tidyverse , ggthemes y ggpubr .
Si no los tiene instalados, use la función install.packages( ) . Una vez hecho esto, debe usar la función library( ) para cargarlos en el entorno R.
Copie los códigos R de la biblioteca y vaya a LuckyTemplates. Abra el editor de R Script y pegue el código. Puede continuar compilando el código R allí.
A continuación, use la función ggplot() para crear un gráfico de dispersión. Primero debe especificar el conjunto de datos que se utilizará en el gráfico, por lo tanto, el comando de base de datos %>% . En este caso, se utiliza un operador de tubería en lugar de una función de filtro.
Para especificar el conjunto de datos, debe usar el argumento aes() y luego especificar su eje x e y. En este caso, es hora de duración y ganancias, respectivamente. Luego, use la función geom_point( ) para mostrar los puntos en el gráfico.
Además, puede realizar cambios de formato en su gráfico de dispersión utilizando una variedad de funciones, como "color" o "forma". Si desea aplicar un aspecto dinámico a su gráfico, puede establecer el color y el tamaño de punto en un valor específico como se ve en el ejemplo.
Cuando ejecute el código, obtendrá este diagrama de dispersión en LuckyTemplates. Observe que obtiene círculos más grandes y de colores más oscuros cuando su valor de tarifa horaria equivalente es más alto.
Agregue una línea suave al gráfico
En el próximo paso, aprenderá cómo agregar una línea suave al gráfico. Una línea suave es una línea que se ajusta a los datos para ayudarlo a explorar las posibles relaciones entre dos variables.
Para agregar una línea suave, use la función geom_smooth() .
Cuando ejecute el script R, el diagrama de dispersión se verá así. La línea suave ahora muestra la tendencia de los datos en un intervalo de confianza del 95 %.
Puede cambiar la escala de los ejes x e y utilizando las funciones scale_x_continuous( ) y scale_y_continuous( ) .
En este caso, el eje y se transforma en una escala logarítmica mientras que el eje x permanece igual.
Cuando ejecuta el código R, los resultados ahora aparecerán logarítmicamente. La línea suave también cambia.
Además, dado que el gráfico coloca automáticamente etiquetas en los ejes, puede eliminarlas utilizando la función labs() .
Dar formato a la apariencia del gráfico de dispersión R
Una vez que haya creado la forma básica de su diagrama de dispersión, el siguiente paso es personalizar su tema y apariencia.
Utilice la función theme( ) para dar formato al gráfico de dispersión en el editor de R Script. Y dentro de esta función, puede agregar otros argumentos para personalizar.
El panel.grid.major( ) y el panel.grid.minor( ) le permiten editar el tipo de línea y el color de las líneas de cuadrícula del gráfico. Si desea eliminar una línea de cuadrícula, use la función element_blank() .
Se eliminan panel.background y plot.background para que el gráfico de dispersión sea transparente . Esto le permite la flexibilidad de colocar su gráfico en cualquier parte de su informe. Si desea eliminar la leyenda de su gráfico, establezca la función legend.position en 'ninguna'.
También puede formatear la línea y el texto de los ejes x e y. Puede hacer que la línea sea más gruesa o más delgada, o que el texto sea más grande o más pequeño.
Si desea obtener información sobre otras funciones de formato que puede usar en su gráfico, puede ir a la sección Ayuda en RStudio . Ingrese "tema" en la barra de búsqueda y aparecerá una lista de funciones de formato.
Hay una variedad de funciones de formato que puede usar en R. Recuerde usar lo que necesita y no se exceda.
Ajuste el color y el rango de los puntos de datos
En la última sección de este tutorial, aprenderá cómo formatear la escala de color y el rango de tamaño de los puntos en su diagrama de dispersión.
La función scale_colour_viridis_b() proporciona mapas de color que son perceptivamente uniformes tanto en color como en blanco y negro. También están diseñados para ser percibidos por espectadores con formas comunes de daltonismo.
Si lo busca en la sección Ayuda en RStudio, verá los diferentes argumentos que puede usar para dar formato a sus gráficos. Puede alternar entre las opciones para averiguar qué resultado se ajusta mejor a su informe.
Por ejemplo, la función scale_size_continuous( ) escala el tamaño de los puntos o formas en un gráfico de acuerdo con una variable continua. Le permite especificar los tamaños de puntos mínimos y máximos que deben usarse en el gráfico.
En este caso, 4 es el mínimo mientras que 17 es el máximo.
Este es ahora el aspecto del gráfico de dispersión final de R.
Conclusión
En este tutorial, aprendió a crear un diagrama de dispersión de R en LuckyTemplates. Un gráfico de dispersión es un tipo de visualización de datos que se utiliza para mostrar la relación entre dos variables continuas. En LuckyTemplates, puede crear un gráfico de dispersión con el paquete ggplot y el objeto visual R Script.
Los diagramas de dispersión son herramientas útiles para visualizar e identificar los patrones y tendencias en los datos. También son útiles para identificar valores atípicos o anomalías.
En general, crear un diagrama de dispersión en LuckyTemplates con R es un proceso sencillo y le permite aprovechar las potentes capacidades de visualización de datos del paquete ggplot.
Mis mejores deseos,
Hossein Seyedagha
Qué es uno mismo en Python: ejemplos del mundo real
Aprenderá a guardar y cargar objetos desde un archivo .rds en R. Este blog también cubrirá cómo importar objetos desde R a LuckyTemplates.
En este tutorial del lenguaje de codificación DAX, aprenda a usar la función GENERAR y a cambiar dinámicamente el título de una medida.
Este tutorial cubrirá cómo usar la técnica de elementos visuales dinámicos de subprocesos múltiples para crear información a partir de visualizaciones de datos dinámicos en sus informes.
En este artículo, repasaré el contexto del filtro. El contexto del filtro es uno de los temas principales que cualquier usuario de LuckyTemplates debería conocer inicialmente.
Quiero mostrar cómo el servicio en línea de LuckyTemplates Apps puede ayudar a administrar diferentes informes e información generada a partir de varias fuentes.
Aprenda a calcular los cambios de su margen de beneficio utilizando técnicas como la bifurcación de medidas y la combinación de fórmulas DAX en LuckyTemplates.
Este tutorial analizará las ideas de materialización de cachés de datos y cómo afectan el rendimiento de DAX al proporcionar resultados.
Si todavía usa Excel hasta ahora, este es el mejor momento para comenzar a usar LuckyTemplates para sus necesidades de informes comerciales.
¿Qué es la puerta de enlace de LuckyTemplates? Todo lo que necesitas saber