Qué es uno mismo en Python: ejemplos del mundo real
Qué es uno mismo en Python: ejemplos del mundo real
Hoy continuaremos con el tema de la comunicación de la investigación mediante R Notebook. Continuaremos trabajando en un marco básico que puede usar para comunicar los resultados de la investigación usando R. Para la primera parte de esta serie sobre la comunicación de la investigación reproducible , échele un vistazo aquí .
Tabla de contenido
Haciendo la Hipótesis
El siguiente paso en nuestro informe es hacer la hipótesis . Crearemos otra sección en el panel del visor y colapsaremos las otras para que podamos ver los informes de alto nivel.
Para la hipótesis, escribiremos que no hay diferencia en el precio de venta de las computadoras con y sin CD-ROM.
Creando los métodos en R Notebook
Pasaremos a los métodos , que abordarán las técnicas reales que usaremos para responder a esa hipótesis. Es posible que no necesitemos hacer ningún tipo de estadística inferencial. Dependiendo de la audiencia, haremos un informe de investigación de alto nivel en este escenario.
Diremos que realizaremos pruebas de muestra con un nivel de confianza del 95% e inspeccionaremos visualmente la distribución de precios. Si son aproximadamente normales, realizaremos la prueba.
Una vez que hayamos guardado nuestra hipótesis y métodos, podemos representarlos como un archivo HTML , un documento PDF o un documento de Word desde la pestaña Vista previa .
Una vez que enviemos esto como HTML, esto es lo que veremos en el cuadro de renderizado.
Aquí dice que se ha creado la salida, así que vayamos a nuestro Explorador de archivos para verificar esto. Una vez que tenemos esto abierto en nuestro archivo HTML, podemos ver que se parece mucho a lo que teníamos en el botón Vista previa.
No estamos viendo ningún mensaje de error en este momento y también vemos espacio para la personalización. Incluso podemos escribir un libro completo o un sitio web usando estas herramientas con R Markdown y R Notebooks .
Volvamos a nuestro guión y continuemos. Escribiremos los métodos que usaremos, así como nuestros resultados. Básicamente estamos abriendo nuestro plan y estamos dejando en claro que no estamos tirando cosas a la pared solo para ver qué se pega. No estamos improvisando cuando llegamos a los datos; en realidad tenemos un plan.
Hay algún beneficio en probar muchas cosas diferentes, ¿verdad? Pero en este enfoque, estamos diciendo a propósito: "Esto es lo que haremos y luego lo haremos".
Trabajando en estadísticas descriptivas en R Notebook
Hagamos nuestras estadísticas descriptivas . Queremos encontrar el precio de cada grupo con y sin CD-ROM. Hay algunas maneras en que podemos hacer esto. Llamaremos a este grupo resumen y traeremos este operador de tubería. Si no está familiarizado con el operador de tubería, puede consultar los recursos de los que hablé anteriormente.
Luego , resumiremos y contaremos los registros para encontrar el precio promedio = precio medio . Por último, querremos imprimir este resumen de grupo y luego ejecutarlo.
Y aquí vamos. Ya tenemos nuestra mesa.
Como dije antes, queremos saber cuántas observaciones hay en cada grupo y cuál es el precio promedio. Podemos hacer esto totalmente dinámico con una referencia en línea.
Haremos un resumen grupal y usaremos operaciones tidyverse . Filtraremos esta fila y luego tomaremos uno de estos valores y lo convertiremos en algo que realmente aparecerá en nuestra referencia en línea aquí.
Después de guardar, vaya a Vista previa del cuaderno para ver el resultado.
Creación de visualizaciones en R Notebook
R es muy conocido por su capacidad de visualización. Para nuestra visualización, usaremos ggplot . Pondremos el precio en el eje X y luego crearemos un histograma . También crearemos múltiplos pequeños para la faceta, que en realidad es bastante fácil de hacer en ggplot .
Podríamos cambiar muchas cosas aquí, como el título, el fondo, el color, etcétera. Una vez que guardamos esto, podemos ver la trama. Esto no es interactivo en este momento, pero hay muchas maneras de hacerlo interactivo en R. Para este ejemplo, estamos haciendo solo un gráfico estático.
Nuestros resultados muestran algo que parece una distribución de curva de campana, lo que significa que debemos continuar con nuestro análisis.
Ejecutaremos los resultados de la prueba T y los conectaremos al informe. Agregaremos otro fragmento R y lo llamaremos cd_test . Si ejecutamos esto ahora, el resultado contendrá mucha información y será muy difícil extraer elementos individuales de él.
Usaremos una función ordenada para poner esto en un formato tabular. Una vez que hagamos un cd_test ordenado , convertirá todo en una buena estructura de tabla. También podríamos imprimir esto para mostrarlo en nuestro informe.
Otra cosa que podríamos hacer es encontrar los intervalos de confianza inferior y superior. No queremos mostrar esta parte porque es solo una puesta en escena.
En general, parece un documento vivo y dinámico, y es mucho mejor que copiar y pegar puntos de datos y tablas individuales en un informe. Puede enviar esto a un compañero de trabajo e, idealmente, puede hacer clic en Vista previa para saber lo que hizo y poder desarrollarlo.
Terminar con una conclusión
Nos estamos acercando al final de nuestro informe, así que escribiremos la conclusión.
También podríamos incluir un apéndice aquí para mostrar nuestros recursos. Lo bueno de tener un apéndice es que si terminas presentándolo o mostrándolo a alguien, te preguntarán quién es tu fuente de datos o cómo se midió algo. Todas estas son preguntas válidas, y tener un apéndice con recursos es realmente útil porque solo puede señalar el apéndice.
También podríamos incluir una imagen y usar texto alternativo . Esta es una buena práctica para describir básicamente lo que muestra una imagen. Si es un usuario de HTML, puede incrustar esta imagen usando HTML.
Conclusión
Para este tutorial, revisamos un informe completo. Este es un borrador muy preliminar, pero logramos usar R Markdown para crear una estructura para nuestro informe de investigación.
Empezamos hablando de reproducibilidad donde todo está documentado. Puede usar R Markdown y este marco para crear cosas como sitios web, libros y blogs. Casi cualquier tipo de producto que necesite crear como analista se puede crear con RStudio.
Para leer más, no dude en consultar mi libro llamado Advancing into Analytics . Esta es una buena introducción básica al análisis de datos y al análisis estadístico con Excel, Python y R. También tengo cursos sobre R para usuarios de LuckyTemplates . Es posible que también vea un tercer curso en esta serie en algún momento.
Espero que hayas aprendido algunas cosas de este tutorial de R Notebook y me encantaría ver cómo terminas usando estas herramientas.
monte george
Qué es uno mismo en Python: ejemplos del mundo real
Aprenderá a guardar y cargar objetos desde un archivo .rds en R. Este blog también cubrirá cómo importar objetos desde R a LuckyTemplates.
En este tutorial del lenguaje de codificación DAX, aprenda a usar la función GENERAR y a cambiar dinámicamente el título de una medida.
Este tutorial cubrirá cómo usar la técnica de elementos visuales dinámicos de subprocesos múltiples para crear información a partir de visualizaciones de datos dinámicos en sus informes.
En este artículo, repasaré el contexto del filtro. El contexto del filtro es uno de los temas principales que cualquier usuario de LuckyTemplates debería conocer inicialmente.
Quiero mostrar cómo el servicio en línea de LuckyTemplates Apps puede ayudar a administrar diferentes informes e información generada a partir de varias fuentes.
Aprenda a calcular los cambios de su margen de beneficio utilizando técnicas como la bifurcación de medidas y la combinación de fórmulas DAX en LuckyTemplates.
Este tutorial analizará las ideas de materialización de cachés de datos y cómo afectan el rendimiento de DAX al proporcionar resultados.
Si todavía usa Excel hasta ahora, este es el mejor momento para comenzar a usar LuckyTemplates para sus necesidades de informes comerciales.
¿Qué es la puerta de enlace de LuckyTemplates? Todo lo que necesitas saber