Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Il pacchetto ggplot2 è il modo più completo per costruire grafici e diagrammi. Le aziende, come il New York Times e The Economist, utilizzano pesantemente ggplot2 per creare le loro visualizzazioni. Con le grandi aziende che utilizzano questo strumento, è importante disporre di una base di conoscenza su come utilizzare ggplot2 per creare visualizzazioni come il jitter plot.

In questo tutorial imparerai come creare un grafico del jitter utilizzando ggplot2 in . Una volta compresa la grammatica della grafica in ggplot2, sarai in grado di mettere insieme qualsiasi grafico o grafico.

Un jitterplot è un tipo di grafico a dispersione utilizzato per visualizzare la distribuzione di un insieme di punti dati numerici. Il "jitter" nel nome del grafico si riferisce alla variazione casuale che viene aggiunta alla posizione di ciascun simbolo lungo gli assi x e y.

Questa variazione aiuta a prevenire la sovrapposizione dei simboli e facilita la visualizzazione della distribuzione dei punti dati nei casi in cui vi sia un'elevata densità di punti in determinate aree del grafico.

Se hai un grafico densamente popolato, un jitterplot può rendere la tua visualizzazione più facile da capire. Puoi anche usarlo per tracciare le distribuzioni per categoria, che è un'alternativa al box plot o all'istogramma .

Sommario

Creazione di un grafico jitter in R

Per questa dimostrazione, viene utilizzato il set di dati tidyverse .

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Innanzitutto, crea un grafico a dispersione utilizzando la funzione ggplot ( ) . In questo caso, l'asse x è l'anno mentre l'asse y è il set di dati mpg.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Quando esegui il codice, puoi vedere che il grafico mostra punti che formano una linea retta rispetto all'asse y.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Utilizzare la funzione geom_jitter ( ) per aggiungere un altro livello al grafico. Quando esegui il codice, vedrai che i punti nel grafico si sono spostati. I punti continueranno a cambiare ogni volta che esegui il codice.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Per evitare che i punti si spostino costantemente, utilizzare la funzione set.seed ( ) . All'interno della parentesi, digita qualsiasi numero casuale. In questo caso, è 1234. Dopo aver eseguito il codice, vedrai che il grafico rimane lo stesso anche se fai ripetutamente clic su Esegui.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Creazione di un grafico Jitter con variabili categoriali

È inoltre possibile utilizzare la funzione geom_jitter ( ) per le variabili categoriali.

Usando lo stesso argomento, cambiamo l'asse x in mpg e l'asse y in origin. Quando esegui la nuova riga di codice, puoi vedere che invece di mostrare i dati in linee rette, sono distribuiti in modo casuale nel grafico.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

Questo ti aiuta a visualizzare le singole osservazioni per ogni categoria e come variano. In questo caso, puoi vedere il chilometraggio tipico di un'origine rispetto a un'altra.

Puoi aggiungere colore al grafico aggiungendo un altro argomento nella funzione aes ( ) . Puoi anche impostare la dimensione dei punti su un valore di dati specifico nel tuo set di dati.

Creazione di un grafico del jitter utilizzando Ggplot2 in RStudio

In questo esempio, il grafico del jitter ha reso più facile identificare le origini con il maggior numero di auto e quelle con un chilometraggio migliore.

A causa delle dimensioni impostate nel codice, la trama sembra troppo satura. È possibile modificare la dimensione o il colore dei punti dati in base alle proprie preferenze o ai requisiti aziendali.

Conclusione

Un grafico del jitter è uno dei modi per portare una nuova forma di intuizione nelle tue visualizzazioni. Aiuta gli utenti a capire meglio cosa sta succedendo con i dati. Questo grafico è un'ottima alternativa al tipico istogramma o box plot per tracciare le distribuzioni.

La capacità di comprendere efficacemente la struttura sottostante di un set di dati rende i grafici del jitter uno strumento prezioso in vari campi come statistica, analisi dei dati e apprendimento automatico. Nel complesso, i grafici del jitter forniscono una rappresentazione chiara e di facile comprensione della distribuzione dei punti dati numerici, rendendolo un potente strumento per la visualizzazione e l'analisi dei dati.

Ti auguro il meglio,

Giorgio Monte


Power Automate si applica a ogni azione nei flussi di lavoro

Power Automate si applica a ogni azione nei flussi di lavoro

Scopri l

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.

Filtro Power Apps: cosè e come si usa?

Filtro Power Apps: cosè e come si usa?

Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Connettori Power Automate: numero, testo e data e ora

Connettori Power Automate: numero, testo e data e ora

Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Ora, è molto facile studiare il budget rispetto all

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.

Che cosè Power Query e M Language: una panoramica dettagliata

Che cosè Power Query e M Language: una panoramica dettagliata

Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.

Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.