Cosè il sé in Python: esempi del mondo reale
Cos'è il sé in Python: esempi del mondo reale
Oggi continueremo sul tema della comunicazione della ricerca utilizzando R Notebook. Continueremo a lavorare su un framework di base che puoi utilizzare per comunicare i risultati della ricerca utilizzando R. Per la prima parte di questa serie sulla comunicazione della ricerca riproducibile , dai un'occhiata qui .
Sommario
Fare l'ipotesi
Il prossimo passo nella nostra relazione è fare l' ipotesi . Creeremo un'altra sezione nel riquadro del visualizzatore e comprimeremo le altre in modo da poter vedere i rapporti di alto livello.
Per ipotesi, scriveremo che non c'è differenza nel prezzo di vendita dei computer con e senza CD-ROM.
Creazione dei metodi in R Notebook
Passeremo ai metodi , che affronteranno le tecniche effettive che useremo per rispondere a tale ipotesi. Potremmo non aver bisogno di fare alcun tipo di statistica inferenziale. A seconda del pubblico, faremo un rapporto di ricerca di alto livello in questo scenario.
Diremo che condurremo test a campione con un livello di confidenza del 95% e ispezioneremo visivamente la distribuzione dei prezzi. Se sono approssimativamente normali, condurremo il test.
Dopo aver salvato le nostre ipotesi e metodi, possiamo visualizzarli come file HTML , documento PDF o documento Word dalla scheda Anteprima .
Dopo averlo inviato come HTML, questo è ciò che vedremo nella finestra di rendering.
Qui dice che l'output è stato creato, quindi andiamo al nostro File Explorer per verificarlo. Dopo averlo aperto nel nostro file HTML, possiamo vedere che sembra molto simile a quello che avevamo nel pulsante Anteprima.
A questo punto non vediamo alcun messaggio di errore e vediamo anche spazio per la personalizzazione. Possiamo persino scrivere un intero libro o un sito Web utilizzando questi strumenti con R Markdown e R Notebooks .
Torniamo al nostro copione e continuiamo. Annoteremo i metodi che useremo così come i nostri risultati. Fondamentalmente stiamo aprendo l'approvvigionamento del nostro piano e stiamo chiarendo che non stiamo lanciando cose contro un muro solo per vedere cosa si attacca. Non stiamo improvvisando quando arriviamo ai dati; in realtà abbiamo un piano.
C'è qualche vantaggio nel provare molte cose diverse, giusto? Ma in questo approccio, diciamo intenzionalmente: "Questo è quello che faremo, e poi lo faremo".
Lavorare su statistiche descrittive in R Notebook
Facciamo le nostre statistiche descrittive . Vogliamo trovare il prezzo per ogni gruppo con e senza CD-ROM. Ci sono alcuni modi in cui possiamo farlo. Chiameremo questo riepilogo di gruppo e inseriremo questo operatore pipe. Se non hai familiarità con l'operatore pipe, puoi controllare le risorse di cui ho parlato prima.
Quindi riepilogheremo e conteremo i record per trovare il prezzo medio = prezzo medio . Infine, vorremo stampare questo riepilogo del gruppo e quindi eseguirlo.
Ed eccoci qui. Ora abbiamo il nostro tavolo.
Come ho detto prima, vogliamo sapere quante osservazioni ci sono in ogni gruppo e qual è il prezzo medio. Possiamo renderlo totalmente dinamico con un riferimento in linea.
Faremo un riepilogo di gruppo e utilizzeremo le operazioni tidyverse . Filtreremo questa riga e quindi prenderemo uno di questi valori e lo trasformeremo in qualcosa che verrà effettivamente visualizzato nel nostro riferimento in linea qui.
Dopo aver salvato, vai su Anteprima taccuino per vedere il risultato.
Costruire visualizzazioni in R Notebook
R è molto noto per la sua capacità di visualizzazione. Per la nostra visualizzazione, useremo ggplot . Metteremo il prezzo sull'asse X e poi creeremo un istogramma . Creeremo anche piccoli multipli per la sfaccettatura, che in realtà è abbastanza facile da fare in ggplot .
Potremmo cambiare molte cose qui come il titolo, lo sfondo, il colore, eccetera. Una volta salvato questo, possiamo vedere la trama. Questo non è interattivo in questo momento, ma ci sono molti modi per renderlo interattivo in R. Per questo esempio, stiamo facendo solo un grafico statico.
I nostri risultati mostrano qualcosa che assomiglia a una distribuzione della curva a campana, il che significa che dovremmo continuare con la nostra analisi.
Eseguiremo i risultati del test T e li collegheremo al rapporto. Aggiungeremo un altro blocco R e lo chiameremo cd_test . Se lo eseguiamo ora, il risultato conterrà molte informazioni e sarà molto difficile estrarne i singoli elementi.
Useremo una funzione ordinata per metterlo in un formato tabulare. Una volta fatto un cd_test ordinato , trasformerà tutto in una bella struttura di tabella. Potremmo anche stamparlo per mostrarlo effettivamente nel nostro rapporto.
Un'altra cosa che potremmo fare è trovare gli intervalli di confidenza inferiore e superiore. Non vogliamo mostrare questa parte perché è solo una messa in scena.
Nel complesso, sembra un documento attivo e dinamico ed è molto meglio che copiare e incollare singoli punti dati e tabelle in un report. Puoi inviarlo a un collega e, idealmente, può semplicemente fare clic su Anteprima per sapere cosa hai fatto ed essere in grado di costruire su questo.
Termina con una conclusione
Ci stiamo avvicinando alla fine del nostro rapporto, quindi scriveremo la conclusione.
Potremmo anche includere un'appendice qui per mostrare le nostre risorse. La cosa bella di avere un'appendice è che se finisci per presentarla o mostrarla a qualcuno, ti chiederanno chi è la tua fonte di dati o come è stato misurato qualcosa. Queste sono tutte domande valide e avere un'appendice con le risorse è davvero utile perché puoi semplicemente indicare l'appendice.
Potremmo anche includere un'immagine e utilizzare alt text . Questa è una buona pratica per descrivere fondamentalmente ciò che mostra un'immagine. Se sei un utente HTML, puoi incorporare questa immagine utilizzando HTML.
Conclusione
Per questo tutorial, abbiamo effettivamente esaminato un intero rapporto. Questa è una bozza molto approssimativa, ma siamo riusciti a utilizzare R Markdown per creare una struttura per il nostro rapporto di ricerca.
Abbiamo iniziato parlando di riproducibilità dove tutto è documentato. Puoi usare R Markdown e questo framework per creare cose come siti web, libri e blog. Quasi ogni tipo di prodotto che devi creare come analista può essere creato utilizzando RStudio.
Per ulteriori letture, sentiti libero di dare un'occhiata al mio libro intitolato Advancing into Analytics . Questa è una buona introduzione di base all'analisi dei dati e all'analisi statistica utilizzando Excel, Python e R. Ho anche corsi su R per utenti di LuckyTemplates . Ad un certo punto potresti vedere anche un terzo corso di questa serie.
Spero che tu abbia imparato alcune cose da questo tutorial di R Notebook e mi piacerebbe vedere come finisci per utilizzare questi strumenti.
Giorgio Monte
Cos'è il sé in Python: esempi del mondo reale
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.
Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.
In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.
Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.
Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.
Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.
Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.
Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere