Wat is zelf in Python: voorbeelden uit de echte wereld
Wat is zelf in Python: voorbeelden uit de echte wereld
Vandaag gaan we verder met het onderwerp van het communiceren van onderzoek met behulp van R Notebook. We blijven werken aan een basiskader dat u kunt gebruiken om onderzoeksresultaten te communiceren met behulp van R. Voor het eerste deel van deze serie over het communiceren van reproduceerbaar onderzoek , kunt u het hier bekijken .
Inhoudsopgave
Het maken van de hypothese
De volgende stap in ons rapport is het maken van de hypothese . We zullen nog een sectie in het viewervenster maken en de andere samenvouwen zodat we de rapporten op hoog niveau kunnen zien.
Voor de hypothese schrijven we dat er geen verschil is in de verkoopprijs van computers met en zonder cd-rom.
De methoden maken in R Notebook
We gaan verder met de methodes , die ingaan op de daadwerkelijke technieken die we zullen gebruiken om die hypothese te beantwoorden. We hoeven misschien geen enkele vorm van inferentiële statistieken te doen. Afhankelijk van het publiek zullen we in dit scenario een onderzoeksrapport op hoog niveau maken.
We zullen zeggen dat we steekproeven zullen uitvoeren met een betrouwbaarheidsniveau van 95% en dat we de prijsverdeling visueel zullen inspecteren. Als ze ongeveer normaal zijn, voeren we de test uit.
Nadat we onze hypothese en methoden hebben opgeslagen, kunnen we ze weergeven als een HTML-bestand , PDF-document of Word-document vanaf het tabblad Voorbeeld .
Zodra we dit als HTML hebben verzonden, zien we dit in het weergavevak.
Hier staat dat de uitvoer is gemaakt, dus laten we naar onze bestandsverkenner gaan om dit te controleren. Zodra we dit hebben geopend in ons HTML-bestand, kunnen we zien dat dit erg lijkt op wat we hadden in de Preview-knop.
Op dit moment zien we geen foutmeldingen en zien we ook ruimte voor maatwerk. We kunnen zelfs een heel boek of website schrijven met behulp van deze tools met R Markdown en R Notebooks .
Laten we teruggaan naar ons script en doorgaan. We zullen de methoden die we zullen gebruiken opschrijven, evenals onze resultaten. We kopen ons plan in feite open en we maken duidelijk dat we geen dingen tegen de muur gooien om te zien wat blijft hangen. We improviseren niet als we bij de gegevens komen; we hebben eigenlijk een plan.
Er is enig voordeel om veel verschillende dingen uit te proberen, toch? Maar in deze benadering zeggen we doelbewust: "Dit is wat we zullen doen, en dan gaan we het doen."
Werken aan beschrijvende statistieken in R Notebook
Laten we onze beschrijvende statistieken doen . We willen de prijs vinden voor elke groep met en zonder cd-rom. Er zijn een paar manieren waarop we dit kunnen doen. We noemen deze groepssamenvatting en schakelen deze pipe-operator in. Als u niet bekend bent met de pipe-operator, kunt u de bronnen bekijken waar ik het eerder over had.
Vervolgens zullen we de records samenvatten en tellen om de gemiddelde prijs = gemiddelde prijs te vinden . Ten slotte willen we dit groepsoverzicht afdrukken en dit vervolgens uitvoeren.
En hier gaan we. We hebben nu onze tafel.
Zoals ik al eerder zei, willen we weten hoeveel waarnemingen er in elke groep zijn en wat de gemiddelde prijs is. Met een inline referentie kunnen we dit helemaal dynamisch maken.
We maken een groepssamenvatting en gebruiken de operaties van Tidgeverse . We filteren deze rij en nemen vervolgens een van deze waarden en veranderen deze in iets dat daadwerkelijk wordt weergegeven in onze inline-referentie hier.
Ga na het opslaan naar Preview Notebook om het resultaat te zien.
Visualisaties maken in R Notebook
R staat bekend om zijn visualisatiemogelijkheden. Voor onze visualisatie gebruiken we ggplot . We plaatsen de prijs op de X-as en maken vervolgens een histogram . We zullen ook kleine veelvouden voor het facet maken, wat eigenlijk vrij eenvoudig te doen is in ggplot .
We zouden hier veel dingen kunnen veranderen, zoals de titel, achtergrond, kleur, et cetera. Zodra we dit opslaan, kunnen we de plot zien. Dit is momenteel niet interactief, maar er zijn veel manieren om het interactief te maken in R. Voor dit voorbeeld doen we alleen een statische plot.
Onze resultaten laten iets zien dat lijkt op een klokkrommeverdeling, wat betekent dat we door moeten gaan met onze analyse.
We voeren de T-testresultaten uit en voegen ze toe aan het rapport. We voegen nog een R-blok toe en noemen het cd_test . Als we dit nu uitvoeren, zal het resultaat veel informatie bevatten en zal het heel moeilijk zijn om er individuele elementen uit te halen.
We gebruiken een functie 'opgeruimd' om dit in tabelvorm te zetten. Zodra we een nette cd_test hebben gedaan , zal het alles in een mooie tabelstructuur veranderen. We kunnen dit ook afdrukken om daadwerkelijk in ons rapport te laten zien.
Een ander ding dat we zouden kunnen doen, is de onderste en bovenste betrouwbaarheidsintervallen vinden. We willen dit deel niet laten zien omdat dit slechts enscenering is.
Over het algemeen ziet het eruit als een levend en dynamisch document en is het zoveel beter dan het kopiëren en plakken van individuele gegevenspunten en tabellen in een rapport. U kunt dit naar een collega sturen en idealiter kunnen ze gewoon op Voorbeeld klikken om te weten wat u hebt gedaan en hierop voort te bouwen.
Eindigend met een conclusie
We naderen het einde van ons rapport, dus we zullen de conclusie schrijven.
We kunnen hier ook een bijlage opnemen om onze bronnen te laten zien. Het leuke aan het hebben van een appendix is dat als je dit uiteindelijk aan iemand presenteert of laat zien, ze zullen vragen wie je gegevensbron is of hoe iets is gemeten. Dit zijn allemaal geldige vragen, en het hebben van een appendix met bronnen is erg handig, want dan kun je gewoon naar de appendix wijzen.
We kunnen ook een afbeelding toevoegen en alt-tekst gebruiken . Dit is een goede gewoonte om in principe te beschrijven wat een afbeelding laat zien. Als u een HTML-gebruiker bent, kunt u deze afbeelding insluiten met behulp van HTML.
Conclusie
Voor deze zelfstudie hebben we eigenlijk een heel rapport doorgenomen. Dit is een zeer ruwe schets, maar we zijn erin geslaagd om R Markdown te gebruiken om een structuur voor ons onderzoeksrapport te creëren.
We begonnen met te praten over reproduceerbaarheid waarbij alles wordt gedocumenteerd. U kunt R Markdown en dit framework gebruiken om zaken als websites, boeken en blogs te maken. Vrijwel elk soort product dat u als analist moet bouwen, kan met RStudio worden gemaakt.
Als u meer wilt lezen, kunt u mijn boek met de naam Advancing into Analytics lezen . Dit is een goede basisinleiding tot data-analyse en statistische analyse met behulp van Excel, Python en R. Ik heb ook cursussen over R voor LuckyTemplates-gebruikers . Misschien zie je op een gegeven moment ook een derde cursus in deze serie.
Ik hoop dat je wat hebt geleerd van deze R Notebook-tutorial en zou graag zien hoe je deze tools gaat gebruiken.
Georg Berg
Wat is zelf in Python: voorbeelden uit de echte wereld
Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.
In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.
Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.
In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.
Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.
Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.
Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.
Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.
Wat is LuckyTemplates Gateway? Alles wat u moet weten