Wat is zelf in Python: voorbeelden uit de echte wereld
Wat is zelf in Python: voorbeelden uit de echte wereld
In deze blogpost kijken we naar het communiceren van onderzoek en het presenteren van die resultaten met behulp van R-notebooks. We hopen dat wat u uit deze zelfstudie haalt, een raamwerk is voor u om onderzoeksbevindingen te rapporteren en te communiceren met behulp van R-notebooks.
Dit heeft enkele grote voordelen, vooral als het gaat om het idee van reproduceerbaar onderzoek . We bespreken wat dit betekent en hoe u dit kunt doen in R-notebooks.
Inhoudsopgave
Wat is reproduceerbaarheid?
Het idee van reproduceerbaarheid is dat iedereen je bevindingen kan controleren en gezien de invoer en de processen die je hebt gebruikt, zouden ze in staat moeten zijn om de hele zaak te doorlopen. Er zijn een paar manieren waarop dit een rol speelt bij onze behoeften op het gebied van gegevensanalyse: een omgeving die dingen reproduceerbaar maakt, ervoor zorgt dat mensen kunnen zien wat er is bijgedragen, een bestand gemakkelijk kunnen controleren en een reproduceerbare uitgever hebben.
Idealiter kan iemand precies zien hoe u bij het rapport bent gekomen en hoe de plot of tabel die u hebt gebruikt is gegenereerd, zodat alles zich in een volledig reproduceerbare omgeving bevindt.
Nu vraag je je misschien af hoe zoiets als LuckyTemplates of Excel hierin past. Ik zou zeggen dat het halverwege deze reproduceerbare workflow is. Als we in het bijzonder aan powerquery denken , is het redelijk goed in reproduceerbaarheid. Denk aan de toegepaste stappen waar het heel duidelijk is om de betrokken processen te zien.
Als het gaat om visualisaties en rapporten, wordt het hier een beetje harig. R Notebooks maken deel uit van RStudio. We hebben een cursus op de LuckyTemplates-portal om u op weg te helpen. Met name deze gaat over R Markdown en R Notebooks in het bijzonder.
Dus als u bekend bent met een Jupyter-notebook , is het idee dat we tekst en code kunnen afwisselen om een verhalend document voor ons onderzoek te maken.
We kunnen die resultaten weergeven in een aantal verschillende uitvoer. Of u nu een PDF moet maken of deze naar HTML moet renderen, R Notebooks kan voor verschillende bestandsindelingen worden gebruikt.
Open om te beginnen uw R-notebook en ga naar Bestand, Nieuw bestand en vervolgens R Notebook in RStudio. We zullen werken met een oudere dataset in de bronnen, met deze heel eenvoudige onderzoeksvraag:
Is de prijs van een computer überhaupt afhankelijk van het al dan niet hebben van een cd-rom?
Deze vraag is achterhaald, maar we moeten allemaal ergens beginnen. We zullen ook het skelet van een onderzoeksrapport plaatsen en de onderzoeksresultaten presenteren met behulp van dit basiskader.
We zullen zoiets in RStudio zien, en dit is een zogenaamd .rmd-bestand, wat een R-markdown-bestandsextensie is. Dit kan een beetje schokkend zijn, vooral als je er niet aan gewend bent, maar er is een manier om een voorbeeld van het gepolijste eindproduct te bekijken.
Dit deel van de notebook is de metadata die het YAML-bestand wordt genoemd.
Na dat gedeelte zijn deze back-teksten waar uw codes naartoe gaan. Dan is er het tekstgedeelte van het document dat R Markdown gebruikt . Als je Markdown al eerder hebt gebruikt, is R markdown redelijk vergelijkbaar. We kunnen zaken als sterretjes en hekjes gebruiken om onze teksten te markeren en weer te geven.
Laten we naar R Studio en R Notebooks gaan en dan samen deze analyse doornemen. Klik op het tandwiel en zorg ervoor dat er Preview in Viewer Pane staat .
Een R-notebook starten
We klikken op de Preview-knop en het zal ons vragen om het op te slaan. Nogmaals, dit is een RMD-bestand, dus we moeten het eerst opslaan. In het linkerdeelvenster zien we de gerenderde uitvoer. Als we hier iets zouden veranderen en zoiets als Computeranalyse zouden zeggen en een auteursnaam als George Mount zouden toevoegen , dan moet dat tussen aanhalingstekens.
Zodra we op Opslaan klikken , wordt dit automatisch bijgewerkt.
Dus laten we hiermee spelen. Er zijn hier al een paar tijdelijke aanduidingen, wat prima is. Het eerste dat we doen, is "Heeft een cd-rom invloed op de verkoopprijs?" Als we dit opslaan, wordt het Header1. Maar als we dit in twee hekjes willen veranderen, wordt het Header2 en wordt het kleiner.
De volgende stap is het doen van een Inleiding , waar we kunnen invoeren waarom dit spul ertoe doet. We kunnen bijvoorbeeld zeggen dat cd-rom het op één na beste is of iets dergelijks. Als je aan consumentenrapporten werkt of op een marketingafdeling werkt, probeer je een idee te krijgen van welke functies echt belangrijk zijn of waar consumenten naar op zoek zijn.
We doen een beroep op R-pakketten en gaan aan de slag. Het enige leuke dat ik hier leuk vind, is dat we HTML daadwerkelijk kunnen gebruiken in R Notebook. Als we bijvoorbeeld een opmerking voor onszelf willen achterlaten, kunnen we zoiets doen.
Wanneer we dit opslaan, wordt het helemaal niet weergegeven. Dus we laten dit gewoon achter als commentaar voor onszelf in de tekst. Dit is iets waarvan ik wou dat we het konden doen in plaatsen zoals MS Word.
Introductie van de pakketten in R-notebooks
De volgende stap is om deze codeplot hier te gebruiken en een aantal instellingen toe te voegen. We kunnen Python en SQL gebruiken, maar we gebruiken R voor dit voorbeeld.
We lezen alle pakketten die we nodig hebben. Als u deze niet op uw computer hebt, moet u deze mogelijk installeren.
Nogmaals, dit is geen volledig rapport. We lopen door een skelet om je een paar dingen te laten zien die je moet weten over R Markdown.
Dus nu gaan we introduceren waar we onze gegevens vandaan halen en wat deze belangrijk maakt. In dit geval zouden we kunnen zeggen dat onze bron het Journal of Applied Econometrics is. Wanneer we dit asterisk-ding doen, wordt het cursief.
Vervolgens lezen we een bestand in Excel en gebruiken we R om het in te voeren. Zoals je kunt zien, zien de gegevens er al redelijk goed uit, wat ook zo cool is aan R Notebooks.
Afhankelijk van het uitvoerformaat kan dit zelfs verschijnen. Als u HTML gebruikt, kan uw gebruiker daadwerkelijk door de gegevens bladeren en wat basisinteractie uitvoeren. Het is geweldig dat we dit echt in live documenten kunnen doen.
Een dynamische referentie toevoegen in R-notebooks
Stel nu dat we een dynamische verwijzing in de tekst van de gegevens willen opnemen. We willen dat dit regelmatig wordt bijgewerkt, omdat dit misschien niet elke keer hetzelfde is als we in het rapport staan, toch? Dus we zullen hier een dynamische verwijzing maken, midden in de tekst.
Er is een spiekbriefje en naslaggids voor al deze codes. Ga naar Help en selecteer die voor R Markdown, zodat je alle verschillende instellingen kunt opzoeken. Het is waarschijnlijk niet de moeite waard om ze uit je hoofd te leren, want er zijn er veel en je kunt dit gewoon gebruiken.
We voegen de R-chunk opnieuw in en nemen FALSE , nrows en ncols op .
Zodra dit is uitgevoerd en uitgevoerd, kunnen we zelfs naar de R-omgeving gaan om te zien of deze in objecten is omgezet.
Een ander ding dat leuk is, is dat als je gewoon met ideeën aan het rondstrooien bent en je wilt weten hoe het er echt uit zal zien, je gewoon de console onderaan kunt gebruiken. We kunnen het op de console uitvoeren en kijken hoe de uitvoer eruit ziet.
We gaan terug naar ons kijkersvenster. Dit gedeelte hier verschijnt helemaal niet in het rapport. Dit is handig als u een object wilt gebruiken, maar niets van de code wilt laten zien.
We gebruiken deze achtergrondteksten op nrows en ncols om de boel dynamisch te houden. Als u een PDF-rapport heeft en u moet deze nummers automatisch wijzigen, in plaats van ze week na week hard te coderen, kunt u deze inline referenties gebruiken.
We zijn bezig de gegevens opnieuw te onderzoeken en de prijs van de computers te controleren.
Zodra we deze code hebben uitgevoerd, kunnen we de beschrijvende statistieken zien die allemaal mooi zijn opgemaakt. Afhankelijk van de grootte van de gegevens, reageert het behoorlijk en reageert het op de grootte van het bestand.
Conclusie
Voor deze zelfstudie hebben we het belang besproken van het ontwikkelen van reproduceerbaar onderzoek en het stroomlijnen van het proces van het communiceren van onderzoeksresultaten door het gebruik van R Notebooks. Op deze manier kunnen we snel en eenvoudig de originele resultaten reproduceren en herleiden om te bepalen hoe ze zijn afgeleid.
Pas op voor de voortzetting van deze tutorial in deel 2 van deze serie.
Georg Berg
Wat is zelf in Python: voorbeelden uit de echte wereld
Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.
In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.
Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.
In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.
Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.
Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.
Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.
Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.
Wat is LuckyTemplates Gateway? Alles wat u moet weten