Comunicación de la investigación con R Notebook - Parte 2

Comunicación de la investigación con R Notebook - Parte 2

Hoy continuaremos con el tema de la comunicación de la investigación mediante R Notebook. Continuaremos trabajando en un marco básico que puede usar para comunicar los resultados de la investigación usando R. Para la primera parte de esta serie sobre la comunicación de la investigación reproducible , échele un vistazo aquí .

Tabla de contenido

Haciendo la Hipótesis

El siguiente paso en nuestro informe es hacer la hipótesis . Crearemos otra sección en el panel del visor y colapsaremos las otras para que podamos ver los informes de alto nivel.

Para la hipótesis, escribiremos que no hay diferencia en el precio de venta de las computadoras con y sin CD-ROM.

Comunicación de la investigación con R Notebook - Parte 2

Creando los métodos en R Notebook

Pasaremos a los métodos , que abordarán las técnicas reales que usaremos para responder a esa hipótesis. Es posible que no necesitemos hacer ningún tipo de estadística inferencial. Dependiendo de la audiencia, haremos un informe de investigación de alto nivel en este escenario.

Diremos que realizaremos pruebas de muestra con un nivel de confianza del 95% e inspeccionaremos visualmente la distribución de precios. Si son aproximadamente normales, realizaremos la prueba.

Comunicación de la investigación con R Notebook - Parte 2

Una vez que hayamos guardado nuestra hipótesis y métodos, podemos representarlos como un archivo HTML , un documento PDF o un documento de Word desde la pestaña Vista previa .

Comunicación de la investigación con R Notebook - Parte 2

Una vez que enviemos esto como HTML, esto es lo que veremos en el cuadro de renderizado.

Comunicación de la investigación con R Notebook - Parte 2

Aquí dice que se ha creado la salida, así que vayamos a nuestro Explorador de archivos para verificar esto. Una vez que tenemos esto abierto en nuestro archivo HTML, podemos ver que se parece mucho a lo que teníamos en el botón Vista previa.

Comunicación de la investigación con R Notebook - Parte 2

No estamos viendo ningún mensaje de error en este momento y también vemos espacio para la personalización. Incluso podemos escribir un libro completo o un sitio web usando estas herramientas con R Markdown y R Notebooks .

Volvamos a nuestro guión y continuemos. Escribiremos los métodos que usaremos, así como nuestros resultados. Básicamente estamos abriendo nuestro plan y estamos dejando en claro que no estamos tirando cosas a la pared solo para ver qué se pega. No estamos improvisando cuando llegamos a los datos; en realidad tenemos un plan.

Hay algún beneficio en probar muchas cosas diferentes, ¿verdad? Pero en este enfoque, estamos diciendo a propósito: "Esto es lo que haremos y luego lo haremos".

Comunicación de la investigación con R Notebook - Parte 2

Trabajando en estadísticas descriptivas en R Notebook

Hagamos nuestras estadísticas descriptivas . Queremos encontrar el precio de cada grupo con y sin CD-ROM. Hay algunas maneras en que podemos hacer esto. Llamaremos a este grupo resumen y traeremos este operador de tubería. Si no está familiarizado con el operador de tubería, puede consultar los recursos de los que hablé anteriormente.

Luego , resumiremos y contaremos los registros para encontrar el precio promedio = precio medio . Por último, querremos imprimir este resumen de grupo y luego ejecutarlo.

Comunicación de la investigación con R Notebook - Parte 2

Y aquí vamos. Ya tenemos nuestra mesa.

Comunicación de la investigación con R Notebook - Parte 2

Como dije antes, queremos saber cuántas observaciones hay en cada grupo y cuál es el precio promedio. Podemos hacer esto totalmente dinámico con una referencia en línea.

Haremos un resumen grupal y usaremos operaciones tidyverse . Filtraremos esta fila y luego tomaremos uno de estos valores y lo convertiremos en algo que realmente aparecerá en nuestra referencia en línea aquí.

Comunicación de la investigación con R Notebook - Parte 2

Después de guardar, vaya a Vista previa del cuaderno para ver el resultado.

Comunicación de la investigación con R Notebook - Parte 2

Comunicación de la investigación con R Notebook - Parte 2

Creación de visualizaciones en R Notebook

R es muy conocido por su capacidad de visualización. Para nuestra visualización, usaremos ggplot . Pondremos el precio en el eje X y luego crearemos un histograma . También crearemos múltiplos pequeños para la faceta, que en realidad es bastante fácil de hacer en ggplot .

Comunicación de la investigación con R Notebook - Parte 2

Comunicación de la investigación con R Notebook - Parte 2

Podríamos cambiar muchas cosas aquí, como el título, el fondo, el color, etcétera. Una vez que guardamos esto, podemos ver la trama. Esto no es interactivo en este momento, pero hay muchas maneras de hacerlo interactivo en R. Para este ejemplo, estamos haciendo solo un gráfico estático.

Comunicación de la investigación con R Notebook - Parte 2

Nuestros resultados muestran algo que parece una distribución de curva de campana, lo que significa que debemos continuar con nuestro análisis.

Ejecutaremos los resultados de la prueba T y los conectaremos al informe. Agregaremos otro fragmento R y lo llamaremos cd_test . Si ejecutamos esto ahora, el resultado contendrá mucha información y será muy difícil extraer elementos individuales de él.

Usaremos una función ordenada para poner esto en un formato tabular. Una vez que hagamos un cd_test ordenado , convertirá todo en una buena estructura de tabla. También podríamos imprimir esto para mostrarlo en nuestro informe.

Comunicación de la investigación con R Notebook - Parte 2

Otra cosa que podríamos hacer es encontrar los intervalos de confianza inferior y superior. No queremos mostrar esta parte porque es solo una puesta en escena.

Comunicación de la investigación con R Notebook - Parte 2

En general, parece un documento vivo y dinámico, y es mucho mejor que copiar y pegar puntos de datos y tablas individuales en un informe. Puede enviar esto a un compañero de trabajo e, idealmente, puede hacer clic en Vista previa para saber lo que hizo y poder desarrollarlo.

Terminar con una conclusión

Nos estamos acercando al final de nuestro informe, así que escribiremos la conclusión.

Comunicación de la investigación con R Notebook - Parte 2

También podríamos incluir un apéndice aquí para mostrar nuestros recursos. Lo bueno de tener un apéndice es que si terminas presentándolo o mostrándolo a alguien, te preguntarán quién es tu fuente de datos o cómo se midió algo. Todas estas son preguntas válidas, y tener un apéndice con recursos es realmente útil porque solo puede señalar el apéndice.

Comunicación de la investigación con R Notebook - Parte 2

También podríamos incluir una imagen y usar texto alternativo . Esta es una buena práctica para describir básicamente lo que muestra una imagen. Si es un usuario de HTML, puede incrustar esta imagen usando HTML.

Comunicación de la investigación con R Notebook - Parte 2

Conclusión

Para este tutorial, revisamos un informe completo. Este es un borrador muy preliminar, pero logramos usar R Markdown para crear una estructura para nuestro informe de investigación.

Empezamos hablando de reproducibilidad donde todo está documentado. Puede usar R Markdown y este marco para crear cosas como sitios web, libros y blogs. Casi cualquier tipo de producto que necesite crear como analista se puede crear con RStudio.

Para leer más, no dude en consultar mi libro llamado Advancing into Analytics . Esta es una buena introducción básica al análisis de datos y al análisis estadístico con Excel, Python y R. También tengo cursos sobre R para usuarios de LuckyTemplates . Es posible que también vea un tercer curso en esta serie en algún momento.

Comunicación de la investigación con R Notebook - Parte 2

Espero que hayas aprendido algunas cosas de este tutorial de R Notebook y me encantaría ver cómo terminas usando estas herramientas.

monte george


Time Intelligence en LuckyTemplates: cómo calcular el número de transacciones realizadas en los últimos N días

Time Intelligence en LuckyTemplates: cómo calcular el número de transacciones realizadas en los últimos N días

Descubra cómo calcular el total de transacciones realizadas en los últimos N días y obtenga información útil utilizando la inteligencia de tiempo en LuckyTemplates.

Cómo evaluar clústeres en sus datos mediante la técnica DAX en LuckyTemplates

Cómo evaluar clústeres en sus datos mediante la técnica DAX en LuckyTemplates

En este tutorial, demuestro cómo mostrar clústeres en sus datos permite extraer información valiosa usando técnicas DAX avanzadas.

¿Cuánto personal tenemos actualmente? Lógica de fechas múltiples en LuckyTemplates usando DAX

¿Cuánto personal tenemos actualmente? Lógica de fechas múltiples en LuckyTemplates usando DAX

En este tutorial, aprenderá a calcular la <strong>población actual del personal</strong> para las relaciones múltiples de la tabla de calendario mediante la función COUNTROWS y FILTER en LuckyTemplates.

Hacer una solicitud HTTP en Power Automate

Hacer una solicitud HTTP en Power Automate

Aprenda a crear una solicitud HTTP con Power Automate y cómo implementar soluciones efectivas para la automatización de tareas.

Programe un flujo de escritorio para que se ejecute en Power Automate

Programe un flujo de escritorio para que se ejecute en Power Automate

En este tutorial, aprenda cómo programar un flujo de escritorio en Power Automate para automatizar tareas en la web y su escritorio.

Power Automate Terminar Control de acción en flujos

Power Automate Terminar Control de acción en flujos

Aprenda a usar correctamente el control Terminar acción de Power Automate que termina las acciones en un flujo si no se cumple alguna de las condiciones.

Power Query: combinar archivos de varias carpetas

Power Query: combinar archivos de varias carpetas

Aprenda a combinar archivos de varias carpetas en su red, escritorio, OneDrive o SharePoint utilizando Power Query.

Tipos de flujo de Power Automate y cuándo usarlos

Tipos de flujo de Power Automate y cuándo usarlos

En este blog, analizamos las similitudes y diferencias entre los tipos de flujo de Power Automate y determinamos cuándo usar cada flujo. Encuentra la mejor opción de automatización.

Conectores de Power Automate: número, texto y fecha y hora

Conectores de Power Automate: número, texto y fecha y hora

Familiarízate con algunos conectores Power Automate integrados que transforman cadenas en otro formato: número, texto y fecha y hora.

Tutorial del analizador VertiPaq: relaciones e integridad referencial

Tutorial del analizador VertiPaq: relaciones e integridad referencial

Este tutorial detallado sobre el analizador VertiPaq en DAX Studio le enseñará cómo usar la pestaña Relaciones para optimizar su DAX y resolver problemas de integridad referencial.