Onderzoek communiceren met R Notebook – Deel 2

Onderzoek communiceren met R Notebook – Deel 2

Vandaag gaan we verder met het onderwerp van het communiceren van onderzoek met behulp van R Notebook. We blijven werken aan een basiskader dat u kunt gebruiken om onderzoeksresultaten te communiceren met behulp van R. Voor het eerste deel van deze serie over het communiceren van reproduceerbaar onderzoek , kunt u het hier bekijken .

Inhoudsopgave

Het maken van de hypothese

De volgende stap in ons rapport is het maken van de hypothese . We zullen nog een sectie in het viewervenster maken en de andere samenvouwen zodat we de rapporten op hoog niveau kunnen zien.

Voor de hypothese schrijven we dat er geen verschil is in de verkoopprijs van computers met en zonder cd-rom.

Onderzoek communiceren met R Notebook – Deel 2

De methoden maken in R Notebook

We gaan verder met de methodes , die ingaan op de daadwerkelijke technieken die we zullen gebruiken om die hypothese te beantwoorden. We hoeven misschien geen enkele vorm van inferentiële statistieken te doen. Afhankelijk van het publiek zullen we in dit scenario een onderzoeksrapport op hoog niveau maken.

We zullen zeggen dat we steekproeven zullen uitvoeren met een betrouwbaarheidsniveau van 95% en dat we de prijsverdeling visueel zullen inspecteren. Als ze ongeveer normaal zijn, voeren we de test uit.

Onderzoek communiceren met R Notebook – Deel 2

Nadat we onze hypothese en methoden hebben opgeslagen, kunnen we ze weergeven als een HTML-bestand , PDF-document of Word-document vanaf het tabblad Voorbeeld .

Onderzoek communiceren met R Notebook – Deel 2

Zodra we dit als HTML hebben verzonden, zien we dit in het weergavevak.

Onderzoek communiceren met R Notebook – Deel 2

Hier staat dat de uitvoer is gemaakt, dus laten we naar onze bestandsverkenner gaan om dit te controleren. Zodra we dit hebben geopend in ons HTML-bestand, kunnen we zien dat dit erg lijkt op wat we hadden in de Preview-knop.

Onderzoek communiceren met R Notebook – Deel 2

Op dit moment zien we geen foutmeldingen en zien we ook ruimte voor maatwerk. We kunnen zelfs een heel boek of website schrijven met behulp van deze tools met R Markdown en R Notebooks .

Laten we teruggaan naar ons script en doorgaan. We zullen de methoden die we zullen gebruiken opschrijven, evenals onze resultaten. We kopen ons plan in feite open en we maken duidelijk dat we geen dingen tegen de muur gooien om te zien wat blijft hangen. We improviseren niet als we bij de gegevens komen; we hebben eigenlijk een plan.

Er is enig voordeel om veel verschillende dingen uit te proberen, toch? Maar in deze benadering zeggen we doelbewust: "Dit is wat we zullen doen, en dan gaan we het doen."

Onderzoek communiceren met R Notebook – Deel 2

Werken aan beschrijvende statistieken in R Notebook

Laten we onze beschrijvende statistieken doen . We willen de prijs vinden voor elke groep met en zonder cd-rom. Er zijn een paar manieren waarop we dit kunnen doen. We noemen deze groepssamenvatting en schakelen deze pipe-operator in. Als u niet bekend bent met de pipe-operator, kunt u de bronnen bekijken waar ik het eerder over had.

Vervolgens zullen we de records samenvatten en tellen om de gemiddelde prijs = gemiddelde prijs te vinden . Ten slotte willen we dit groepsoverzicht afdrukken en dit vervolgens uitvoeren.

Onderzoek communiceren met R Notebook – Deel 2

En hier gaan we. We hebben nu onze tafel.

Onderzoek communiceren met R Notebook – Deel 2

Zoals ik al eerder zei, willen we weten hoeveel waarnemingen er in elke groep zijn en wat de gemiddelde prijs is. Met een inline referentie kunnen we dit helemaal dynamisch maken.

We maken een groepssamenvatting en gebruiken de operaties van Tidgeverse . We filteren deze rij en nemen vervolgens een van deze waarden en veranderen deze in iets dat daadwerkelijk wordt weergegeven in onze inline-referentie hier.

Onderzoek communiceren met R Notebook – Deel 2

Ga na het opslaan naar Preview Notebook om het resultaat te zien.

Onderzoek communiceren met R Notebook – Deel 2

Onderzoek communiceren met R Notebook – Deel 2

Visualisaties maken in R Notebook

R staat bekend om zijn visualisatiemogelijkheden. Voor onze visualisatie gebruiken we ggplot . We plaatsen de prijs op de X-as en maken vervolgens een histogram . We zullen ook kleine veelvouden voor het facet maken, wat eigenlijk vrij eenvoudig te doen is in ggplot .

Onderzoek communiceren met R Notebook – Deel 2

Onderzoek communiceren met R Notebook – Deel 2

We zouden hier veel dingen kunnen veranderen, zoals de titel, achtergrond, kleur, et cetera. Zodra we dit opslaan, kunnen we de plot zien. Dit is momenteel niet interactief, maar er zijn veel manieren om het interactief te maken in R. Voor dit voorbeeld doen we alleen een statische plot.

Onderzoek communiceren met R Notebook – Deel 2

Onze resultaten laten iets zien dat lijkt op een klokkrommeverdeling, wat betekent dat we door moeten gaan met onze analyse.

We voeren de T-testresultaten uit en voegen ze toe aan het rapport. We voegen nog een R-blok toe en noemen het cd_test . Als we dit nu uitvoeren, zal het resultaat veel informatie bevatten en zal het heel moeilijk zijn om er individuele elementen uit te halen.

We gebruiken een functie 'opgeruimd' om dit in tabelvorm te zetten. Zodra we een nette cd_test hebben gedaan , zal het alles in een mooie tabelstructuur veranderen. We kunnen dit ook afdrukken om daadwerkelijk in ons rapport te laten zien.

Onderzoek communiceren met R Notebook – Deel 2

Een ander ding dat we zouden kunnen doen, is de onderste en bovenste betrouwbaarheidsintervallen vinden. We willen dit deel niet laten zien omdat dit slechts enscenering is.

Onderzoek communiceren met R Notebook – Deel 2

Over het algemeen ziet het eruit als een levend en dynamisch document en is het zoveel beter dan het kopiëren en plakken van individuele gegevenspunten en tabellen in een rapport. U kunt dit naar een collega sturen en idealiter kunnen ze gewoon op Voorbeeld klikken om te weten wat u hebt gedaan en hierop voort te bouwen.

Eindigend met een conclusie

We naderen het einde van ons rapport, dus we zullen de conclusie schrijven.

Onderzoek communiceren met R Notebook – Deel 2

We kunnen hier ook een bijlage opnemen om onze bronnen te laten zien. Het leuke aan het hebben van een appendix is ​​dat als je dit uiteindelijk aan iemand presenteert of laat zien, ze zullen vragen wie je gegevensbron is of hoe iets is gemeten. Dit zijn allemaal geldige vragen, en het hebben van een appendix met bronnen is erg handig, want dan kun je gewoon naar de appendix wijzen.

Onderzoek communiceren met R Notebook – Deel 2

We kunnen ook een afbeelding toevoegen en alt-tekst gebruiken . Dit is een goede gewoonte om in principe te beschrijven wat een afbeelding laat zien. Als u een HTML-gebruiker bent, kunt u deze afbeelding insluiten met behulp van HTML.

Onderzoek communiceren met R Notebook – Deel 2

Conclusie

Voor deze zelfstudie hebben we eigenlijk een heel rapport doorgenomen. Dit is een zeer ruwe schets, maar we zijn erin geslaagd om R Markdown te gebruiken om een ​​structuur voor ons onderzoeksrapport te creëren.

We begonnen met te praten over reproduceerbaarheid waarbij alles wordt gedocumenteerd. U kunt R Markdown en dit framework gebruiken om zaken als websites, boeken en blogs te maken. Vrijwel elk soort product dat u als analist moet bouwen, kan met RStudio worden gemaakt.

Als u meer wilt lezen, kunt u mijn boek met de naam Advancing into Analytics lezen . Dit is een goede basisinleiding tot data-analyse en statistische analyse met behulp van Excel, Python en R. Ik heb ook cursussen over R voor LuckyTemplates-gebruikers . Misschien zie je op een gegeven moment ook een derde cursus in deze serie.

Onderzoek communiceren met R Notebook – Deel 2

Ik hoop dat je wat hebt geleerd van deze R Notebook-tutorial en zou graag zien hoe je deze tools gaat gebruiken.

Georg Berg


Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Een RDS-bestand opslaan en laden in R

Een RDS-bestand opslaan en laden in R

Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.

First N Business Days Revisited – Een DAX-coderingstaaloplossing

First N Business Days Revisited – Een DAX-coderingstaaloplossing

In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.

Inleiding tot het filteren van context in LuckyTemplates

Inleiding tot het filteren van context in LuckyTemplates

In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.

Zakelijke rapportage met behulp van LuckyTemplates

Zakelijke rapportage met behulp van LuckyTemplates

Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten