En esta publicación de blog, veremos la comunicación de la investigación y la presentación de esos resultados mediante cuadernos R. Esperamos que lo que obtendrá de este tutorial sea un marco para que informe y comunique cualquier tipo de hallazgos de investigación utilizando cuadernos R.
Hay algunas grandes ventajas al hacer esto, particularmente cuando se trata de la idea de una investigación reproducible . Discutiremos qué significa esto y cómo hacerlo en cuadernos R.

Tabla de contenido
¿Qué es la reproducibilidad?
La idea de la reproducibilidad es que cualquiera pueda auditar sus hallazgos y, dadas las entradas y los procesos que utilizó, deberían poder recorrer todo el proceso. Hay algunas maneras en que esto entra en juego para nuestras necesidades de análisis de datos: un entorno que hace que las cosas sean reproducibles, asegurándose de que las personas puedan ver lo que se contribuyó, poder auditar fácilmente un archivo y tener un editor reproducible.
Idealmente, alguien puede ver exactamente cómo llegó al informe y cómo se generó el gráfico o la tabla que usó para que todo esté en un entorno totalmente reproducible.
Ahora puede que se pregunte cómo encaja algo como LuckyTemplates o Excel en esto. Yo diría que está a mitad de camino en este flujo de trabajo reproducible. Cuando pensamos en Power Query en particular, es bastante bueno en reproducibilidad. Piense en los Pasos aplicados donde es muy obvio ver los procesos involucrados.
Cuando se trata de visualizaciones e informes, aquí es donde las cosas se ponen un poco más complicadas. Los cuadernos R son parte de RStudio. Tenemos un curso en el portal LuckyTemplates para ponerlo en marcha. Este en particular habla sobre R Markdown y R Notebooks en particular.
Entonces, si está familiarizado con un cuaderno Jupyter , la idea es que podamos intercalar texto y código para crear un documento narrativo para nuestra investigación.
Podremos representar esos resultados en un montón de salidas diferentes. Ya sea que necesite crear un PDF o convertirlo en HTML, R Notebooks se puede usar para diferentes formatos de archivo.

Para comenzar, abra su cuaderno R y vaya a Archivo, Nuevo archivo, luego Cuaderno R en RStudio. Trabajaremos con un conjunto de datos más antiguo en los recursos, con esta pregunta de investigación realmente simple:
¿Depende el precio de una computadora de si tiene o no un CD-ROM?
Esta pregunta está desactualizada, pero todos tenemos que empezar en alguna parte. También pondremos el esqueleto de un informe de investigación y presentaremos los resultados de la investigación utilizando este marco básico.

Veremos algo como esto en RStudio, y esto es lo que se llama un archivo .rmd, que es una extensión de archivo de descuento R. Esto puede ser un poco molesto, especialmente si no está acostumbrado, pero hay una manera de obtener una vista previa del producto final pulido.

Esta parte del cuaderno son los metadatos llamados archivo YAML.

Después de esa sección están estos textos traseros donde irán sus códigos. Luego está la parte de texto del documento usando R Markdown . Si ha usado Markdown antes, R markdown es bastante similar. Podemos usar elementos como asteriscos y almohadillas para marcar y representar nuestros textos.
Vayamos a R Studio y R Notebooks, luego analicemos juntos este análisis. Haga clic en la rueda dentada y asegúrese de que dice Vista previa en el panel del visor .

Inicio de un cuaderno R
Haremos clic en el botón Preview y nos pedirá que lo guardemos. Nuevamente, este es un archivo RMD, por lo que primero debemos guardarlo. En el panel izquierdo, veremos la salida renderizada. Ahora, si tuviéramos que cambiar algo aquí y decir algo como Análisis de computadoras y agregar un nombre de autor como George Mount , tendrá que ir entre comillas.
Una vez que hagamos clic en Guardar , automáticamente se actualizará a esto.

Así que juguemos con esto. Ya hay un par de marcadores de posición aquí, lo cual está bien. Lo primero que haremos será teclear “¿Afecta un CD-ROM el precio de venta?” Cuando guardemos esto, será Header1. Pero si vamos a convertir esto en dos marcas hash, se convertirá en Header2 y será más pequeño.

El siguiente paso es hacer una Introducción , donde podemos ingresar por qué estas cosas son importantes. Por ejemplo, podemos decir que el CD-ROM es la segunda opción o algo así. Si está trabajando en informes de consumidores o en un departamento de marketing, está tratando de tener una idea de qué funciones son realmente importantes o qué buscan los consumidores.
Llamaremos a los paquetes R y comenzaremos. Lo bueno que me encanta aquí es que podemos usar HTML en R Notebook. Por ejemplo, si queremos dejarnos un comentario a nosotros mismos, podemos hacer algo como esto.

Cuando guardamos esto, no aparece en absoluto. Así que estamos dejando esto como un comentario para nosotros mismos en el texto. Esto es algo que me gustaría que pudiéramos hacer en lugares como MS Word.
Presentamos los paquetes en portátiles R
El siguiente paso es usar este diagrama de código aquí y agregar un par de configuraciones. Podemos usar Python y SQL, pero estamos usando R para este ejemplo.
Leeremos todos los paquetes que necesitamos. Si no los tiene en su computadora, es posible que deba instalarlos.

Una vez más, este no es un informe completo. Recorreremos un esqueleto para mostrarle un par de cosas que debe saber sobre R Markdown.
Así que ahora vamos a presentar de dónde obtenemos nuestros datos y qué los hace importantes. En este caso, podríamos decir que nuestra fuente es el Journal of Applied Econometrics. Cuando hacemos esto del asterisco, lo convertirá en cursiva.

Luego, leeremos un archivo en Excel y usaremos R para incorporarlo. Como puede ver, los datos ya se ven bastante bien, lo cual es otra cosa interesante de R Notebooks.

Dependiendo del formato de salida, esto podría incluso aparecer. Si está utilizando HTML, su usuario podría hojear los datos y realizar alguna interacción básica. Es genial que realmente podamos hacer esto en documentos en vivo.

Agregar una referencia dinámica en cuadernos R
Ahora digamos que queremos incluir una referencia dinámica en el texto de los datos. Queremos que esto se actualice regularmente porque es posible que no sea lo mismo cada vez que estemos en el informe, ¿verdad? Así que haremos una referencia dinámica aquí en línea, justo en el texto.
Hay una hoja de trucos y una guía de referencia para todos estos códigos. Vaya a Ayuda y seleccione el de R Markdown para que pueda buscar todas las configuraciones diferentes. Probablemente no valga la pena tratar de memorizarlos porque hay muchos y puedes usar esto en su lugar.

Insertaremos el fragmento R nuevamente e incluiremos FALSE , nrows y ncols .

Una vez que esto se haya ejecutado y ejecutado, incluso podríamos ir al entorno R para ver si se ha convertido en objetos.

Otra cosa que es buena es que si solo estás lanzando ideas y quieres saber cómo se verá realmente, puedes usar la consola en la parte inferior. Podemos ejecutarlo en la consola y ver cómo se ve el resultado.

Volveremos a nuestro panel de visor. Ahora bien, esta sección de aquí no aparece en absoluto en el informe. Esto es bueno si quiere usar algún objeto, pero no quiere mostrar nada del código.

Usamos estos textos posteriores en nrows y ncols para mantener las cosas dinámicas. Si tiene un informe en PDF y necesita cambiar automáticamente estos números, en lugar de codificarlos semana tras semana, puede usar estas referencias en línea.

Estamos en el proceso de explorar los datos nuevamente y verificar el precio de las computadoras.

Una vez que ejecutamos este código, podemos ver las estadísticas descriptivas que están bien formateadas. Dependiendo del tamaño de los datos, es bastante receptivo y reactivo al tamaño del archivo.

Conclusión
Para este tutorial, hemos discutido la importancia de desarrollar investigaciones reproducibles y simplificar el proceso de comunicar los resultados de la investigación mediante el uso de R Notebooks. De esta manera, podemos reproducir rápida y fácilmente los resultados originales y rastrear para determinar cómo se obtuvieron.
Tenga cuidado con la continuación de este tutorial en la parte 2 de esta serie.
monte george