Wat is zelf in Python: voorbeelden uit de echte wereld
Wat is zelf in Python: voorbeelden uit de echte wereld
Het ggplot2- pakket is de meest uitgebreide manier om grafieken en plots te bouwen. Bedrijven, zoals de New York Times en The Economist, maken intensief gebruik van ggplot2 om hun visualisaties te maken. Met grote bedrijven die deze tool gebruiken, is het belangrijk om een kennisbank te hebben over hoe ggplot2 te gebruiken om visualisaties te maken, zoals de jitterplot.
In deze zelfstudie leert u hoe u een jitterplot kunt maken met ggplot2 in . Zodra u de grammatica van afbeeldingen in ggplot2 begrijpt, kunt u elke grafiek of plot aan elkaar rijgen.
Een jitterplot is een soort scatterplot dat wordt gebruikt om de verdeling van een reeks numerieke gegevenspunten weer te geven. De "jitter" in de naam van de plot verwijst naar de willekeurige variatie die wordt toegevoegd aan de positie van elk symbool langs de x- en y-as.
Deze variatie helpt voorkomen dat symbolen elkaar overlappen en maakt het gemakkelijker om de verdeling van gegevenspunten te zien in het geval dat er een hoge dichtheid van punten is in bepaalde gebieden van de plot.
Als u een dichtbevolkte plot heeft, kan een jitterplot uw visualisatie begrijpelijker maken. U kunt het ook gebruiken om verdelingen per categorie te plotten, wat een alternatief is voor een boxplot of een histogram .
Inhoudsopgave
Een Jitter-plot maken in R
Voor deze demonstratie wordt gebruik gemaakt van de Titverse dataset.
Maak eerst een spreidingsplot met de functie ggplot ( ) . In dit geval is de x-as het jaar, terwijl de y-as de mpg-gegevensset is.
Wanneer u de code uitvoert, kunt u zien dat de plot punten toont die een rechte lijn vormen ten opzichte van de y-as.
Gebruik de functie geom_jitter ( ) om nog een laag aan de grafiek toe te voegen. Wanneer u de code uitvoert, ziet u dat de punten in de plot zijn verschoven. De punten blijven verschuiven elke keer dat u de code uitvoert.
Gebruik de functie set.seed ( ) om te voorkomen dat de punten voortdurend verschuiven . Typ tussen haakjes een willekeurig getal in. In dit geval is het 1234. Nadat u de code hebt uitgevoerd, ziet u dat de plot hetzelfde blijft, zelfs als u herhaaldelijk op Uitvoeren klikt.
Een Jitter-plot maken met categorische variabelen
U kunt ook de functie geom_jitter ( ) gebruiken voor categorische variabelen.
Laten we met hetzelfde argument de x-as veranderen in mpg en de y-as in oorsprong. Wanneer u de nieuwe coderegel uitvoert, kunt u zien dat de gegevens niet in rechte lijnen worden weergegeven, maar willekeurig in de plot worden verdeeld.
Dit helpt u de individuele waarnemingen voor elke categorie te visualiseren en hoe deze variëren. In dit geval kunt u de typische kilometerstand van de ene oorsprong versus de andere zien.
U kunt kleur aan de plot toevoegen door een ander argument toe te voegen in de functie aes ( ) . U kunt de grootte van de punten ook instellen op een specifieke gegevenswaarde in uw gegevensset.
In dit voorbeeld maakte de jitter-plot het gemakkelijker om de oorsprong te identificeren met de meeste auto's en auto's met een betere kilometerstand.
Vanwege de grootte die in de code is ingesteld, ziet de plot er oververzadigd uit. U kunt de grootte of kleur van de gegevenspunten wijzigen, afhankelijk van uw voorkeur of zakelijke vereisten.
Conclusie
Een jitterplot is een van de manieren om een nieuwe vorm van inzicht in uw visualisaties te brengen. Het helpt gebruikers beter te begrijpen wat er met gegevens gebeurt. Deze plot is een geweldig alternatief voor het typische histogram of boxplot voor het plotten van verdelingen.
Het vermogen om de onderliggende structuur van een dataset effectief te begrijpen, maakt jitterplots een waardevol hulpmiddel op verschillende gebieden, zoals statistiek, data-analyse en machine learning. Over het algemeen bieden jitterplots een duidelijke en gemakkelijk te begrijpen weergave van de verdeling van numerieke gegevenspunten, waardoor het een krachtig hulpmiddel is voor gegevensvisualisatie en -analyse.
Al het beste,
Georg Berg
Wat is zelf in Python: voorbeelden uit de echte wereld
Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.
In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.
Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.
In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.
Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.
Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.
Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.
Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.
Wat is LuckyTemplates Gateway? Alles wat u moet weten