Crearea unui grafic Jitter folosind Ggplot2 în RStudio

Pachetul ggplot2 este cel mai cuprinzător mod de a construi grafice și diagrame. Firme, precum New York Times și The Economist, folosesc în mare măsură ggplot2 pentru a-și crea vizualizările. Cu marile companii care folosesc acest instrument, este important să aveți o bază de cunoștințe despre cum să utilizați ggplot2 pentru a crea vizualizări, cum ar fi diagrama jitter.

În acest tutorial, veți învăța cum să creați o diagramă jitter folosind ggplot2 în . Odată ce înțelegeți gramatica graficelor în ggplot2, veți putea să înșiri orice grafic sau diagramă.

Un jitterplot este un tip de grafic de dispersie utilizat pentru a afișa distribuția unui set de puncte de date numerice. „Jtter-ul” din numele diagramei se referă la variația aleatoare care este adăugată la poziția fiecărui simbol de-a lungul axelor x și y.

Această variație ajută la prevenirea suprapunerii simbolurilor și facilitează vizualizarea distribuției punctelor de date în cazurile în care există o densitate mare de puncte în anumite zone ale diagramei.

Dacă aveți o parcelă dens populată, un jitterplot vă poate face vizualizarea mai ușor de înțeles. De asemenea, îl puteți folosi pentru a trasa distribuțiile pe categorii, care este o alternativă la un diagramă cu casete sau o histogramă .

Cuprins

Crearea unui grafic Jitter în R

Pentru această demonstrație, se utilizează setul de date tidyverse .

Crearea unui grafic Jitter folosind Ggplot2 în RStudio

Mai întâi, creați un grafic de dispersie folosind funcția ggplot ( ) . În acest caz, axa x este anul, în timp ce axa y este setul de date mpg.

Crearea unui grafic Jitter folosind Ggplot2 în RStudio

Când rulați codul, puteți vedea că graficul arată puncte care formează o linie dreaptă în raport cu axa y.

Crearea unui grafic Jitter folosind Ggplot2 în RStudio

Utilizați funcția geom_jitter ( ) pentru a adăuga un alt strat la grafic. Când rulați codul, veți vedea că punctele din diagramă s-au deplasat. Punctele vor continua să se schimbe de fiecare dată când rulați codul.

Crearea unui grafic Jitter folosind Ggplot2 în RStudio

Pentru a opri deplasarea constantă a punctelor, utilizați funcția set.seed ( ) . În interiorul parantezei, introduceți orice număr aleatoriu. În acest caz, este 1234. După ce rulați codul, veți vedea că graficul rămâne același chiar dacă faceți clic în mod repetat pe Run.

Crearea unui grafic Jitter folosind Ggplot2 în RStudio

Crearea unui grafic Jitter cu variabile categoriale

De asemenea, puteți utiliza funcția geom_jitter ( ) pentru variabilele categoriale.

Folosind același argument, să schimbăm axa x la mpg și axa y la origine. Când rulați noua linie de cod, puteți vedea că, în loc să afișați datele în linii drepte, acestea sunt distribuite aleatoriu în diagramă.

Crearea unui grafic Jitter folosind Ggplot2 în RStudio

Acest lucru vă ajută să vizualizați observațiile individuale pentru fiecare categorie și modul în care acestea variază. În acest caz, puteți vedea kilometrajul tipic dintr-o origine față de alta.

Puteți adăuga culoare graficului adăugând un alt argument în funcția aes ( ) . De asemenea, puteți seta dimensiunea punctelor la o anumită valoare a datelor din setul dvs. de date.

Crearea unui grafic Jitter folosind Ggplot2 în RStudio

În acest exemplu, diagrama jitter a făcut mai ușor să identifici originile cu cele mai multe mașini și cu cele care au un kilometraj mai bun.

Din cauza dimensiunii stabilite în cod, intriga pare suprasaturată. Puteți modifica dimensiunea sau culoarea punctelor de date în funcție de preferințele dvs. sau de cerințele companiei.

Concluzie

Un complot jitter este una dintre modalitățile de a aduce o nouă formă de perspectivă în vizualizările dvs. Ajută utilizatorii să înțeleagă mai bine ce se întâmplă cu datele. Acest grafic este o alternativă excelentă la histograma tipică sau diagrama cu casete pentru trasarea distribuțiilor.

Capacitatea de a înțelege în mod eficient structura de bază a unui set de date face din graficele jitter un instrument valoros în diverse domenii, cum ar fi statistica, analiza datelor și învățarea automată. În general, diagramele de fluctuație oferă o reprezentare clară și ușor de înțeles a distribuției punctelor de date numerice, făcându-l un instrument puternic pentru vizualizarea și analiza datelor.

Toate cele bune,

George Mount

Leave a Comment

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Cum să salvați și să încărcați un fișier RDS în R

Cum să salvați și să încărcați un fișier RDS în R

Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.

Introducere la filtrarea contextului în LuckyTemplates

Introducere la filtrarea contextului în LuckyTemplates

În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.

Idei de materializare pentru cache-urile de date în DAX Studio

Idei de materializare pentru cache-urile de date în DAX Studio

Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.

Raportare de afaceri folosind LuckyTemplates

Raportare de afaceri folosind LuckyTemplates

Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți