R Caiete pentru comunicarea cercetării

În această postare pe blog, ne vom uita la comunicarea cercetării și la prezentarea acestor rezultate folosind caietele R. Sperăm că ceea ce veți obține din acest tutorial este un cadru pentru a raporta și a comunica orice fel de rezultate ale cercetării folosind notebook-urile R.

Există câteva avantaje mari în a face acest lucru, în special când vine vorba de ideea de cercetare reproductibilă . Vom discuta ce înseamnă acest lucru și cum să o facem în notebook-urile R.

R Caiete pentru comunicarea cercetării

Cuprins

Ce este reproductibilitatea?

Ideea de reproductibilitate este că oricine vă poate audita constatările și, având în vedere intrările și procesele pe care le-ați folosit, ar trebui să poată parcurge totul. Există câteva moduri în care acest lucru intră în joc pentru nevoile noastre de analiză a datelor: un mediu care face lucrurile reproductibile, asigurându-ne că oamenii pot vedea ceea ce a contribuit, putând audita cu ușurință un fișier și având un editor reproductibil.

În mod ideal, cineva poate vedea exact cum ați ajuns la raport și cum a fost generat graficul sau tabelul pe care l-ați folosit, astfel încât totul să fie într-un mediu complet reproductibil.

Acum s-ar putea să vă întrebați cum se potrivește ceva precum LuckyTemplates sau Excel în asta. Aș spune că este la jumătatea acestui flux de lucru reproductibil. Când ne gândim în special la interogare de putere , este destul de bun la reproductibilitate. Gândiți-vă la pașii aplicați , unde este foarte evident să vedeți procesele implicate.

Când vine vorba de vizualizări și rapoarte, aici lucrurile devin puțin mai păroase. R Notebook-urile fac parte din RStudio. Avem un curs la portalul LuckyTemplates pentru a vă pune în funcțiune. Acest în special, vorbește despre R Markdown și R Notebook-uri în special.

Deci, dacă sunteți familiarizat cu un caiet Jupyter , ideea este că putem să intercalăm text și cod pentru a crea un document de povestire pentru cercetarea noastră.

Vom fi capabili să redăm acele rezultate într-o mulțime de rezultate diferite. Indiferent dacă trebuie să creați un PDF sau să îl redați în HTML, R Notebooks poate fi folosit pentru diferite formate de fișiere.

R Caiete pentru comunicarea cercetării

Pentru a începe, deschideți blocnotesul R și accesați Fișier, Fișier nou, apoi Blocnotes R în RStudio. Vom lucra cu un set de date mai vechi din resurse, cu această întrebare de cercetare foarte simplă:

Prețul unui computer depinde deloc de dacă are sau nu un CD-ROM?

Această întrebare este depășită, dar toți trebuie să începem de undeva. De asemenea, vom pune scheletul unui raport de cercetare și vom prezenta rezultatele cercetării folosind acest cadru de bază.

R Caiete pentru comunicarea cercetării

Vom vedea așa ceva în RStudio și acesta este ceea ce se numește un fișier .rmd, care este o extensie de fișier R markdown. Acest lucru poate fi puțin tulburător, mai ales dacă nu sunteți obișnuit, dar există o modalitate de a previzualiza produsul final lustruit.

R Caiete pentru comunicarea cercetării

Această parte a blocnotesului este metadatele numite fișier YAML.

R Caiete pentru comunicarea cercetării

După acea secțiune sunt aceste texte din spate unde vor merge codurile dvs. Apoi este partea de text a documentului folosind R Markdown . Dacă ați mai folosit Markdown, R markdown este destul de similar. Putem folosi lucruri precum asteriscuri și semne hash pentru a marca și a reda textele noastre.

Să mergem la R Studio și R Notebooks, apoi parcurgem această analiză împreună. Faceți clic pe roata dințată și asigurați-vă că acesta este scris Previzualizare în panoul de vizualizare .

R Caiete pentru comunicarea cercetării

Pornirea unui notebook R

Vom face clic pe butonul Previzualizare și ne va cere să-l salvăm. Din nou, acesta este un fișier RMD, așa că va trebui să-l salvăm mai întâi. În panoul din stânga, vom vedea rezultatul randat. Acum, dacă ar fi să schimbăm ceva aici și să spunem ceva de genul Analiza computerelor și să adăugăm un nume de autor precum George Mount , va trebui să fie între ghilimele.

După ce facem clic pe Salvare , se va actualiza automat la aceasta.

R Caiete pentru comunicarea cercetării

Deci hai să ne jucăm cu asta. Există deja câteva substituenți aici, ceea ce este în regulă. Primul lucru pe care îl vom face este să scriem „Afectează un CD-ROM prețul de vânzare?” Când salvăm acest lucru, acesta va fi Header1. Dar dacă trebuie să transformăm acest lucru în două semne hash, se va transforma în Header2 și va fi mai mic.

R Caiete pentru comunicarea cercetării

Următorul pas este să facem o Introducere , unde putem introduce de ce contează aceste lucruri. De exemplu, putem spune că CD-ROM-ul este următorul cel mai bun lucru sau ceva de genul ăsta. Dacă lucrați la rapoarte pentru consumatori sau lucrați la un departament de marketing, încercați să înțelegeți ce caracteristici sunt cu adevărat importante sau ce caută consumatorii.

Vom apela la pachetele R și vom începe. Singurul lucru frumos care îmi place aici este că putem folosi HTML în R Notebook. De exemplu, dacă vrem să ne lăsăm un comentariu, putem face așa ceva.

R Caiete pentru comunicarea cercetării

Când salvăm asta, nu apare deloc. Așa că lăsăm asta doar ca un comentariu pentru noi înșine în text. Acesta este ceva ce mi-aș dori să putem face în locuri precum MS Word.

Prezentarea pachetelor din R Notebook-uri

Următorul pas este să utilizați acest grafic de cod aici și să adăugați câteva setări. Putem folosi Python și SQL, dar folosim R pentru acest exemplu.

Vom citi toate pachetele de care avem nevoie. Dacă nu le aveți pe computer, poate fi necesar să le instalați.

R Caiete pentru comunicarea cercetării

Din nou, acesta nu este un raport complet. Vom parcurge un schelet pentru a vă arăta câteva lucruri de știut despre R Markdown.

Așa că acum vom prezenta de unde obținem datele noastre și ce le face importante. În acest caz, am putea spune că sursa noastră este Journal of Applied Econometrics. Când facem asta cu asteriscul, o va transforma în cursive.

R Caiete pentru comunicarea cercetării

Apoi vom citi un fișier în Excel și vom folosi R pentru a-l aduce. După cum puteți vedea, datele arată deja destul de bine, ceea ce este un alt lucru interesant la R Notebook-uri.

R Caiete pentru comunicarea cercetării

În funcție de formatul de ieșire, acesta ar putea chiar să apară. Dacă utilizați HTML, utilizatorul dvs. ar putea de fapt să parcurgă datele și să facă unele interacțiuni de bază. Este grozav că suntem cu adevărat capabili să le facem în documente live.

R Caiete pentru comunicarea cercetării

Adăugarea unei referințe dinamice în R Notebooks

Acum să presupunem că vrem să includem o referință dinamică în textul datelor. Dorim ca acest lucru să se actualizeze în mod regulat, deoarece este posibil să nu fie același de fiecare dată când participăm la raport, nu? Așa că vom face o referință dinamică aici în linie, chiar în text.

Există o foaie de cheat și un ghid de referință pentru toate aceste coduri. Accesați Ajutor și selectați-l pe cel pentru R Markdown, astfel încât să puteți căuta toate setările diferite. Probabil că nu merită să încerci să le memorezi pentru că sunt multe și poți să folosești asta în schimb.

R Caiete pentru comunicarea cercetării

Vom insera din nou fragmentul R și vom include FALSE , nrows și ncols .

R Caiete pentru comunicarea cercetării

Odată ce acest lucru a fost rulat și executat, am putea chiar să mergem în mediul R pentru a vedea dacă a fost transformat în obiecte.

R Caiete pentru comunicarea cercetării

Un alt lucru care este drăguț este că, dacă doar aruncați idei și doriți să știți cum va arăta de fapt, puteți utiliza doar consola din partea de jos. Îl putem rula la consolă și vedem cum arată rezultatul.

R Caiete pentru comunicarea cercetării

Vom reveni la panoul de vizualizare. Acum, această secțiune de aici nu apare deloc în raport. Acest lucru este frumos dacă doriți să utilizați un obiect, dar nu doriți să afișați niciun cod.

R Caiete pentru comunicarea cercetării

Folosim aceste texte din spate pe nrows și ncols pentru a menține lucrurile dinamice. Dacă aveți un raport PDF și trebuie să schimbați automat aceste numere, în loc să le codificați săptămânal după săptămână, puteți utiliza aceste referințe inline.

R Caiete pentru comunicarea cercetării

Suntem în proces de a explora din nou datele și de a verifica prețul computerelor.

R Caiete pentru comunicarea cercetării

Odată ce rulăm acest cod, putem vedea statisticile descriptive care sunt toate frumos formatate. În funcție de dimensiunea datelor, este destul de receptivă și reactivă la dimensiunea fișierului.

R Caiete pentru comunicarea cercetării

Concluzie

Pentru acest tutorial, am discutat despre importanța dezvoltării cercetării reproductibile și a eficientizării procesului de comunicare a rezultatelor cercetării prin utilizarea notebook-urilor R. În acest fel, putem reproduce rapid și ușor rezultatele originale și urmărim înapoi pentru a determina cum au fost derivate. 

Vă rugăm să fiți atenți la continuarea acestui tutorial în partea 2 a acestei serii.

George Mount

Leave a Comment

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Cum să salvați și să încărcați un fișier RDS în R

Cum să salvați și să încărcați un fișier RDS în R

Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.

Introducere la filtrarea contextului în LuckyTemplates

Introducere la filtrarea contextului în LuckyTemplates

În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.

Idei de materializare pentru cache-urile de date în DAX Studio

Idei de materializare pentru cache-urile de date în DAX Studio

Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.

Raportare de afaceri folosind LuckyTemplates

Raportare de afaceri folosind LuckyTemplates

Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți