Comunicare la ricerca con R Notebook – Parte 2

Comunicare la ricerca con R Notebook – Parte 2

Oggi continueremo sul tema della comunicazione della ricerca utilizzando R Notebook. Continueremo a lavorare su un framework di base che puoi utilizzare per comunicare i risultati della ricerca utilizzando R. Per la prima parte di questa serie sulla comunicazione della ricerca riproducibile , dai un'occhiata qui .

Sommario

Fare l'ipotesi

Il prossimo passo nella nostra relazione è fare l' ipotesi . Creeremo un'altra sezione nel riquadro del visualizzatore e comprimeremo le altre in modo da poter vedere i rapporti di alto livello.

Per ipotesi, scriveremo che non c'è differenza nel prezzo di vendita dei computer con e senza CD-ROM.

Comunicare la ricerca con R Notebook – Parte 2

Creazione dei metodi in R Notebook

Passeremo ai metodi , che affronteranno le tecniche effettive che useremo per rispondere a tale ipotesi. Potremmo non aver bisogno di fare alcun tipo di statistica inferenziale. A seconda del pubblico, faremo un rapporto di ricerca di alto livello in questo scenario.

Diremo che condurremo test a campione con un livello di confidenza del 95% e ispezioneremo visivamente la distribuzione dei prezzi. Se sono approssimativamente normali, condurremo il test.

Comunicare la ricerca con R Notebook – Parte 2

Dopo aver salvato le nostre ipotesi e metodi, possiamo visualizzarli come file HTML , documento PDF o documento Word dalla scheda Anteprima .

Comunicare la ricerca con R Notebook – Parte 2

Dopo averlo inviato come HTML, questo è ciò che vedremo nella finestra di rendering.

Comunicare la ricerca con R Notebook – Parte 2

Qui dice che l'output è stato creato, quindi andiamo al nostro File Explorer per verificarlo. Dopo averlo aperto nel nostro file HTML, possiamo vedere che sembra molto simile a quello che avevamo nel pulsante Anteprima.

Comunicare la ricerca con R Notebook – Parte 2

A questo punto non vediamo alcun messaggio di errore e vediamo anche spazio per la personalizzazione. Possiamo persino scrivere un intero libro o un sito Web utilizzando questi strumenti con R Markdown e R Notebooks .

Torniamo al nostro copione e continuiamo. Annoteremo i metodi che useremo così come i nostri risultati. Fondamentalmente stiamo aprendo l'approvvigionamento del nostro piano e stiamo chiarendo che non stiamo lanciando cose contro un muro solo per vedere cosa si attacca. Non stiamo improvvisando quando arriviamo ai dati; in realtà abbiamo un piano.

C'è qualche vantaggio nel provare molte cose diverse, giusto? Ma in questo approccio, diciamo intenzionalmente: "Questo è quello che faremo, e poi lo faremo".

Comunicare la ricerca con R Notebook – Parte 2

Lavorare su statistiche descrittive in R Notebook

Facciamo le nostre statistiche descrittive . Vogliamo trovare il prezzo per ogni gruppo con e senza CD-ROM. Ci sono alcuni modi in cui possiamo farlo. Chiameremo questo riepilogo di gruppo e inseriremo questo operatore pipe. Se non hai familiarità con l'operatore pipe, puoi controllare le risorse di cui ho parlato prima.

Quindi riepilogheremo e conteremo i record per trovare il prezzo medio = prezzo medio . Infine, vorremo stampare questo riepilogo del gruppo e quindi eseguirlo.

Comunicare la ricerca con R Notebook – Parte 2

Ed eccoci qui. Ora abbiamo il nostro tavolo.

Comunicare la ricerca con R Notebook – Parte 2

Come ho detto prima, vogliamo sapere quante osservazioni ci sono in ogni gruppo e qual è il prezzo medio. Possiamo renderlo totalmente dinamico con un riferimento in linea.

Faremo un riepilogo di gruppo e utilizzeremo le operazioni tidyverse . Filtreremo questa riga e quindi prenderemo uno di questi valori e lo trasformeremo in qualcosa che verrà effettivamente visualizzato nel nostro riferimento in linea qui.

Comunicare la ricerca con R Notebook – Parte 2

Dopo aver salvato, vai su Anteprima taccuino per vedere il risultato.

Comunicare la ricerca con R Notebook – Parte 2

Comunicare la ricerca con R Notebook – Parte 2

Costruire visualizzazioni in R Notebook

R è molto noto per la sua capacità di visualizzazione. Per la nostra visualizzazione, useremo ggplot . Metteremo il prezzo sull'asse X e poi creeremo un istogramma . Creeremo anche piccoli multipli per la sfaccettatura, che in realtà è abbastanza facile da fare in ggplot .

Comunicare la ricerca con R Notebook – Parte 2

Comunicare la ricerca con R Notebook – Parte 2

Potremmo cambiare molte cose qui come il titolo, lo sfondo, il colore, eccetera. Una volta salvato questo, possiamo vedere la trama. Questo non è interattivo in questo momento, ma ci sono molti modi per renderlo interattivo in R. Per questo esempio, stiamo facendo solo un grafico statico.

Comunicare la ricerca con R Notebook – Parte 2

I nostri risultati mostrano qualcosa che assomiglia a una distribuzione della curva a campana, il che significa che dovremmo continuare con la nostra analisi.

Eseguiremo i risultati del test T e li collegheremo al rapporto. Aggiungeremo un altro blocco R e lo chiameremo cd_test . Se lo eseguiamo ora, il risultato conterrà molte informazioni e sarà molto difficile estrarne i singoli elementi.

Useremo una funzione ordinata per metterlo in un formato tabulare. Una volta fatto un cd_test ordinato , trasformerà tutto in una bella struttura di tabella. Potremmo anche stamparlo per mostrarlo effettivamente nel nostro rapporto.

Comunicare la ricerca con R Notebook – Parte 2

Un'altra cosa che potremmo fare è trovare gli intervalli di confidenza inferiore e superiore. Non vogliamo mostrare questa parte perché è solo una messa in scena.

Comunicare la ricerca con R Notebook – Parte 2

Nel complesso, sembra un documento attivo e dinamico ed è molto meglio che copiare e incollare singoli punti dati e tabelle in un report. Puoi inviarlo a un collega e, idealmente, può semplicemente fare clic su Anteprima per sapere cosa hai fatto ed essere in grado di costruire su questo.

Termina con una conclusione

Ci stiamo avvicinando alla fine del nostro rapporto, quindi scriveremo la conclusione.

Comunicare la ricerca con R Notebook – Parte 2

Potremmo anche includere un'appendice qui per mostrare le nostre risorse. La cosa bella di avere un'appendice è che se finisci per presentarla o mostrarla a qualcuno, ti chiederanno chi è la tua fonte di dati o come è stato misurato qualcosa. Queste sono tutte domande valide e avere un'appendice con le risorse è davvero utile perché puoi semplicemente indicare l'appendice.

Comunicare la ricerca con R Notebook – Parte 2

Potremmo anche includere un'immagine e utilizzare alt text . Questa è una buona pratica per descrivere fondamentalmente ciò che mostra un'immagine. Se sei un utente HTML, puoi incorporare questa immagine utilizzando HTML.

Comunicare la ricerca con R Notebook – Parte 2

Conclusione

Per questo tutorial, abbiamo effettivamente esaminato un intero rapporto. Questa è una bozza molto approssimativa, ma siamo riusciti a utilizzare R Markdown per creare una struttura per il nostro rapporto di ricerca.

Abbiamo iniziato parlando di riproducibilità dove tutto è documentato. Puoi usare R Markdown e questo framework per creare cose come siti web, libri e blog. Quasi ogni tipo di prodotto che devi creare come analista può essere creato utilizzando RStudio.

Per ulteriori letture, sentiti libero di dare un'occhiata al mio libro intitolato Advancing into Analytics . Questa è una buona introduzione di base all'analisi dei dati e all'analisi statistica utilizzando Excel, Python e R. Ho anche corsi su R per utenti di LuckyTemplates . Ad un certo punto potresti vedere anche un terzo corso di questa serie.

Comunicare la ricerca con R Notebook – Parte 2

Spero che tu abbia imparato alcune cose da questo tutorial di R Notebook e mi piacerebbe vedere come finisci per utilizzare questi strumenti.

Giorgio Monte


Power Automate si applica a ogni azione nei flussi di lavoro

Power Automate si applica a ogni azione nei flussi di lavoro

Scopri l

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.

Filtro Power Apps: cosè e come si usa?

Filtro Power Apps: cosè e come si usa?

Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Connettori Power Automate: numero, testo e data e ora

Connettori Power Automate: numero, testo e data e ora

Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Ora, è molto facile studiare il budget rispetto all

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.

Che cosè Power Query e M Language: una panoramica dettagliata

Che cosè Power Query e M Language: una panoramica dettagliata

Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.

Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.