Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Il pacchetto ggplot2 è il modo più completo per costruire grafici e diagrammi. Le aziende, come il New York Times e The Economist, utilizzano pesantemente ggplot2 per creare le loro visualizzazioni. Con le grandi aziende che utilizzano questo strumento, è importante disporre di una base di conoscenza su come utilizzare ggplot2 per creare visualizzazioni come il jitter plot.

In questo tutorial imparerai come creare un grafico del jitter utilizzando ggplot2 in . Una volta compresa la grammatica della grafica in ggplot2, sarai in grado di mettere insieme qualsiasi grafico o grafico.

Un jitterplot è un tipo di grafico a dispersione utilizzato per visualizzare la distribuzione di un insieme di punti dati numerici. Il "jitter" nel nome del grafico si riferisce alla variazione casuale che viene aggiunta alla posizione di ciascun simbolo lungo gli assi x e y.

Questa variazione aiuta a prevenire la sovrapposizione dei simboli e facilita la visualizzazione della distribuzione dei punti dati nei casi in cui vi sia un'elevata densità di punti in determinate aree del grafico.

Se hai un grafico densamente popolato, un jitterplot può rendere la tua visualizzazione più facile da capire. Puoi anche usarlo per tracciare le distribuzioni per categoria, che è un'alternativa al box plot o all'istogramma .

Sommario

Creazione di un grafico jitter in R

Per questa dimostrazione, viene utilizzato il set di dati tidyverse .

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Innanzitutto, crea un grafico a dispersione utilizzando la funzione ggplot ( ) . In questo caso, l'asse x è l'anno mentre l'asse y è il set di dati mpg.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Quando esegui il codice, puoi vedere che il grafico mostra punti che formano una linea retta rispetto all'asse y.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Utilizzare la funzione geom_jitter ( ) per aggiungere un altro livello al grafico. Quando esegui il codice, vedrai che i punti nel grafico si sono spostati. I punti continueranno a cambiare ogni volta che esegui il codice.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Per evitare che i punti si spostino costantemente, utilizzare la funzione set.seed ( ) . All'interno della parentesi, digita qualsiasi numero casuale. In questo caso, è 1234. Dopo aver eseguito il codice, vedrai che il grafico rimane lo stesso anche se fai ripetutamente clic su Esegui.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Creazione di un grafico Jitter con variabili categoriali

È inoltre possibile utilizzare la funzione geom_jitter ( ) per le variabili categoriali.

Usando lo stesso argomento, cambiamo l'asse x in mpg e l'asse y in origin. Quando esegui la nuova riga di codice, puoi vedere che invece di mostrare i dati in linee rette, sono distribuiti in modo casuale nel grafico.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Questo ti aiuta a visualizzare le singole osservazioni per ogni categoria e come variano. In questo caso, puoi vedere il chilometraggio tipico di un'origine rispetto a un'altra.

Puoi aggiungere colore al grafico aggiungendo un altro argomento nella funzione aes ( ) . Puoi anche impostare la dimensione dei punti su un valore di dati specifico nel tuo set di dati.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

In questo esempio, il grafico del jitter ha reso più facile identificare le origini con il maggior numero di auto e quelle con un chilometraggio migliore.

A causa delle dimensioni impostate nel codice, la trama sembra troppo satura. È possibile modificare la dimensione o il colore dei punti dati in base alle proprie preferenze o ai requisiti aziendali.

Conclusione

Un grafico del jitter è uno dei modi per portare una nuova forma di intuizione nelle tue visualizzazioni. Aiuta gli utenti a capire meglio cosa sta succedendo con i dati. Questo grafico è un'ottima alternativa al tipico istogramma o box plot per tracciare le distribuzioni.

La capacità di comprendere efficacemente la struttura sottostante di un set di dati rende i grafici del jitter uno strumento prezioso in vari campi come statistica, analisi dei dati e apprendimento automatico. Nel complesso, i grafici del jitter forniscono una rappresentazione chiara e di facile comprensione della distribuzione dei punti dati numerici, rendendolo un potente strumento per la visualizzazione e l'analisi dei dati.

Ti auguro il meglio,

Giorgio Monte


Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.

Mostra approfondimenti utilizzando la tecnica di visualizzazione dinamica multi-thread in LuckyTemplates

Mostra approfondimenti utilizzando la tecnica di visualizzazione dinamica multi-thread in LuckyTemplates

Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.

Introduzione al filtraggio del contesto in LuckyTemplates

Introduzione al filtraggio del contesto in LuckyTemplates

In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.

I migliori suggerimenti per lutilizzo delle app nel servizio online LuckyTemplates

I migliori suggerimenti per lutilizzo delle app nel servizio online LuckyTemplates

Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.

Analizza le variazioni del margine di profitto nel tempo: analisi con LuckyTemplates e DAX

Analizza le variazioni del margine di profitto nel tempo: analisi con LuckyTemplates e DAX

Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.

Idee di materializzazione per cache di dati in DAX Studio

Idee di materializzazione per cache di dati in DAX Studio

Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.

Reporting aziendale tramite LuckyTemplates

Reporting aziendale tramite LuckyTemplates

Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.

Che cosè il gateway LuckyTemplates? Tutto quello che devi sapere

Che cosè il gateway LuckyTemplates? Tutto quello che devi sapere

Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere