Wat is zelf in Python: voorbeelden uit de echte wereld
Wat is zelf in Python: voorbeelden uit de echte wereld
In deze zelfstudie leert u hoe u een spreidingsplotvisualisatie kunt maken met behulp van een R-script. Dit is gebaseerd op een rapport dat is ingediend voor de . Je kunt de volledige video van deze tutorial onderaan deze blog bekijken.
Inhoudsopgave
Wat is een scatterplot
Een spreidingsplot is een type gegevensvisualisatie dat wordt gebruikt om de relatie tussen twee continue variabelen weer te geven. Het is een grafiek waarin elk gegevenspunt wordt weergegeven door een stip en de positie van de stip op de horizontale en verticale as komt overeen met de waarden van de twee variabelen.
Spreidingsplots zijn handige hulpmiddelen voor het identificeren van patronen en trends in de gegevens. Door deze visual toe te voegen aan uw LuckyTemplates-rapporten krijgt u meer inzicht in de gegevens die u presenteert. En aan het einde van deze zelfstudie kunt u een R-spreidingsplot maken dat er als volgt uitziet:
Dit gesprek is opgedeeld in vier stappen. U leert eerst hoe u een basisspreidingsplot maakt. Vervolgens past u een vloeiende lijn toe om de trend van de gegevens in de plot weer te geven. De derde en vierde stap zijn voornamelijk gericht op thema's en opmaakwijzigingen die u kunt toepassen op de spreidingsplot.
De gegevensset die in dit voorbeeld wordt gebruikt, is een tabel met de naam van de klant, de duur, de inkomsten en het uurtarief.
Creëer de Basic Scatter Plot in de R Script Visual
Open uw .
Om te beginnen, moet u drie pakketten in uw RStudio-programma hebben geïnstalleerd , de Tidyverse , ggthemes en ggpubr .
Als je ze niet hebt geïnstalleerd, gebruik dan de install.packages( ) functie. Als u klaar bent, moet u de functie library( ) gebruiken om ze in de R-omgeving te laden.
Kopieer de R-codes van de bibliotheek en ga naar LuckyTemplates. Open de R Script-editor en plak de code. Daar kun je verder bouwen aan de R-code.
Gebruik vervolgens de functie ggplot( ) om een spreidingsdiagram te maken. U moet eerst de dataset specificeren die in de grafiek zal worden gebruikt, vandaar de opdracht database %>% . In dit geval wordt een pipe-operator gebruikt in plaats van een filterfunctie.
Om de dataset te specificeren, moet u het argument aes( ) gebruiken en vervolgens uw x- en y-as specificeren. In dit geval is het respectievelijk de duur van het uur en de inkomsten. Gebruik vervolgens de functie geom_point( ) om de punten op de kaart weer te geven.
U kunt verder opmaakwijzigingen aanbrengen in uw spreidingsplot door verschillende functies te gebruiken, zoals "kleur" of "vorm". Als u een dynamisch uiterlijk op uw diagram wilt toepassen, kunt u de kleur en puntgrootte instellen op een specifieke waarde, zoals te zien is in het voorbeeld.
Wanneer u de code uitvoert, krijgt u deze spreidingsplot in LuckyTemplates. Merk op dat u grotere en donkerder gekleurde cirkels krijgt wanneer hun equivalente uurtariefwaarde hoger is.
Voeg een vloeiende lijn toe aan de grafiek
In deze volgende stap leert u hoe u een vloeiende lijn aan het diagram kunt toevoegen. Een vloeiende lijn is een lijn die is aangepast aan de gegevens om u te helpen de mogelijke relaties tussen twee variabelen te verkennen.
Gebruik de functie geom_smooth( ) om een vloeiende lijn toe te voegen .
Wanneer u het R-script uitvoert, ziet de spreidingsplot er zo uit. De vloeiende lijn toont nu de trend van de gegevens met een betrouwbaarheidsinterval van 95%.
U kunt de schaal van de x- en y-as wijzigen met de functies scale_x_continuous( ) en scale_y_continuous( ) .
In dit geval wordt de y-as getransformeerd naar een logaritmische schaal terwijl de x-as hetzelfde blijft.
Wanneer u de R-code uitvoert, worden de resultaten nu logaritmisch weergegeven. De vloeiende lijn verandert ook.
Aangezien het diagram automatisch labels op de assen plaatst, kunt u ze bovendien verwijderen met de functie labs( ) .
Formatteer het uiterlijk van de R-spreidingsgrafiek
Nadat u de basisvorm van uw spreidingsplot hebt gemaakt, is de volgende stap het aanpassen van het thema en uiterlijk.
Gebruik de functie theme( ) om de spreidingsplot in de R Script-editor op te maken. En binnen deze functie kunt u andere argumenten toevoegen om aan te passen.
Met panel.grid.major ( ) en panel.grid.minor( ) kunt u het lijntype en de kleur van de rasterlijnen van het diagram bewerken. Als u een rasterlijn wilt verwijderen, gebruikt u de functie element_blank( ) .
De panel.background en plot.background worden verwijderd om het spreidingsdiagram transparant te maken. Dit geeft u de flexibiliteit om uw diagram overal in uw rapport te plaatsen. Als u de legenda in uw grafiek wilt verwijderen, stelt u de functie legend.position in op 'none'.
U kunt ook de lijn en tekst van de x- en y-as opmaken. U kunt de lijn dikker of dunner maken, of de tekst groter of kleiner maken.
Als u meer wilt weten over andere opmaakfuncties die u in uw diagram kunt gebruiken, gaat u naar de Help-sectie in RStudio . Typ "thema" in de zoekbalk en er verschijnt een lijst met opmaakfuncties.
Er zijn verschillende opmaakfuncties die u in R kunt gebruiken. Vergeet niet te gebruiken wat u nodig heeft en overdrijf het niet.
Pas de kleur en het bereik van de gegevenspunten aan
In het laatste deel van deze zelfstudie leert u hoe u de kleurenschaal en het groottebereik van de punten in uw spreidingsplot kunt opmaken.
De functie scale_colour_viridis_b( ) biedt kleurenkaarten die perceptueel uniform zijn in zowel kleur als zwart-wit. Ze zijn ook ontworpen om te worden waargenomen door kijkers met veelvoorkomende vormen van kleurenblindheid.
Als u ernaar zoekt in de Help-sectie in RStudio, ziet u de verschillende argumenten die u kunt gebruiken om uw diagrammen op te maken. U kunt schakelen tussen de opties om erachter te komen welk resultaat het beste bij uw rapport past.
De functie scale_size_continuous( ) schaalt bijvoorbeeld de grootte van punten of vormen in een plot op basis van een continue variabele. Hiermee kunt u de minimale en maximale puntgrootte specificeren die in de plot moeten worden gebruikt.
In dit geval is 4 het minimum en 17 het maximum.
Dit is nu hoe de uiteindelijke R-spreidingsplot eruit ziet.
Conclusie
In deze zelfstudie hebt u geleerd hoe u een R-spreidingsplot maakt in LuckyTemplates. Een spreidingsplot is een type gegevensvisualisatie dat wordt gebruikt om de relatie tussen twee continue variabelen weer te geven. In LuckyTemplates kunt u een spreidingsplot maken met behulp van het ggplot-pakket en de R Script-visual.
Spreidingsplots zijn handige hulpmiddelen voor het visualiseren en identificeren van de patronen en trends in de gegevens. Ze zijn ook nuttig voor het identificeren van uitschieters of anomalieën.
Over het algemeen is het maken van een spreidingsplot in LuckyTemplates met behulp van R een eenvoudig proces en kunt u profiteren van de krachtige gegevensvisualisatiemogelijkheden van het ggplot-pakket.
Al het beste,
Hossein Seyedagha
Wat is zelf in Python: voorbeelden uit de echte wereld
Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.
In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.
Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.
In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.
Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.
Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.
Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.
Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.
Wat is LuckyTemplates Gateway? Alles wat u moet weten