Een Jitter-plot maken met Ggplot2 in RStudio

Een Jitter-plot maken met Ggplot2 in RStudio

Het ggplot2- pakket is de meest uitgebreide manier om grafieken en plots te bouwen. Bedrijven, zoals de New York Times en The Economist, maken intensief gebruik van ggplot2 om hun visualisaties te maken. Met grote bedrijven die deze tool gebruiken, is het belangrijk om een ​​kennisbank te hebben over hoe ggplot2 te gebruiken om visualisaties te maken, zoals de jitterplot.

In deze zelfstudie leert u hoe u een jitterplot kunt maken met ggplot2 in . Zodra u de grammatica van afbeeldingen in ggplot2 begrijpt, kunt u elke grafiek of plot aan elkaar rijgen.

Een jitterplot is een soort scatterplot dat wordt gebruikt om de verdeling van een reeks numerieke gegevenspunten weer te geven. De "jitter" in de naam van de plot verwijst naar de willekeurige variatie die wordt toegevoegd aan de positie van elk symbool langs de x- en y-as.

Deze variatie helpt voorkomen dat symbolen elkaar overlappen en maakt het gemakkelijker om de verdeling van gegevenspunten te zien in het geval dat er een hoge dichtheid van punten is in bepaalde gebieden van de plot.

Als u een dichtbevolkte plot heeft, kan een jitterplot uw visualisatie begrijpelijker maken. U kunt het ook gebruiken om verdelingen per categorie te plotten, wat een alternatief is voor een boxplot of een histogram .

Inhoudsopgave

Een Jitter-plot maken in R

Voor deze demonstratie wordt gebruik gemaakt van de Titverse dataset.

Een Jitter-plot maken met Ggplot2 in RStudio

Maak eerst een spreidingsplot met de functie ggplot ( ) . In dit geval is de x-as het jaar, terwijl de y-as de mpg-gegevensset is.

Een Jitter-plot maken met Ggplot2 in RStudio

Wanneer u de code uitvoert, kunt u zien dat de plot punten toont die een rechte lijn vormen ten opzichte van de y-as.

Een Jitter-plot maken met Ggplot2 in RStudio

Gebruik de functie geom_jitter ( ) om nog een laag aan de grafiek toe te voegen. Wanneer u de code uitvoert, ziet u dat de punten in de plot zijn verschoven. De punten blijven verschuiven elke keer dat u de code uitvoert.

Een Jitter-plot maken met Ggplot2 in RStudio

Gebruik de functie set.seed ( ) om te voorkomen dat de punten voortdurend verschuiven . Typ tussen haakjes een willekeurig getal in. In dit geval is het 1234. Nadat u de code hebt uitgevoerd, ziet u dat de plot hetzelfde blijft, zelfs als u herhaaldelijk op Uitvoeren klikt.

Een Jitter-plot maken met Ggplot2 in RStudio

Een Jitter-plot maken met categorische variabelen

U kunt ook de functie geom_jitter ( ) gebruiken voor categorische variabelen.

Laten we met hetzelfde argument de x-as veranderen in mpg en de y-as in oorsprong. Wanneer u de nieuwe coderegel uitvoert, kunt u zien dat de gegevens niet in rechte lijnen worden weergegeven, maar willekeurig in de plot worden verdeeld.

Een Jitter-plot maken met Ggplot2 in RStudio

Dit helpt u de individuele waarnemingen voor elke categorie te visualiseren en hoe deze variëren. In dit geval kunt u de typische kilometerstand van de ene oorsprong versus de andere zien.

U kunt kleur aan de plot toevoegen door een ander argument toe te voegen in de functie aes ( ) . U kunt de grootte van de punten ook instellen op een specifieke gegevenswaarde in uw gegevensset.

Een Jitter-plot maken met Ggplot2 in RStudio

In dit voorbeeld maakte de jitter-plot het gemakkelijker om de oorsprong te identificeren met de meeste auto's en auto's met een betere kilometerstand.

Vanwege de grootte die in de code is ingesteld, ziet de plot er oververzadigd uit. U kunt de grootte of kleur van de gegevenspunten wijzigen, afhankelijk van uw voorkeur of zakelijke vereisten.

Conclusie

Een jitterplot is een van de manieren om een ​​nieuwe vorm van inzicht in uw visualisaties te brengen. Het helpt gebruikers beter te begrijpen wat er met gegevens gebeurt. Deze plot is een geweldig alternatief voor het typische histogram of boxplot voor het plotten van verdelingen.

Het vermogen om de onderliggende structuur van een dataset effectief te begrijpen, maakt jitterplots een waardevol hulpmiddel op verschillende gebieden, zoals statistiek, data-analyse en machine learning. Over het algemeen bieden jitterplots een duidelijke en gemakkelijk te begrijpen weergave van de verdeling van numerieke gegevenspunten, waardoor het een krachtig hulpmiddel is voor gegevensvisualisatie en -analyse.

Al het beste,

Georg Berg


Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Een RDS-bestand opslaan en laden in R

Een RDS-bestand opslaan en laden in R

Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.

First N Business Days Revisited – Een DAX-coderingstaaloplossing

First N Business Days Revisited – Een DAX-coderingstaaloplossing

In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.

Inleiding tot het filteren van context in LuckyTemplates

Inleiding tot het filteren van context in LuckyTemplates

In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.

Zakelijke rapportage met behulp van LuckyTemplates

Zakelijke rapportage met behulp van LuckyTemplates

Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten