Graficul de dispersie în scriptul R: Cum se creează și se importă

Graficul de dispersie în scriptul R: Cum se creează și se importă

În acest tutorial, veți învăța cum să creați o vizualizare grafică de dispersie folosind un script R. Aceasta se bazează pe un raport trimis pentru . Puteți viziona videoclipul complet al acestui tutorial în partea de jos a acestui blog.

Cuprins

Ce este diagrama de dispersie

Un grafic de dispersie este un tip de vizualizare a datelor care este utilizat pentru a afișa relația dintre două variabile continue. Este un grafic în care fiecare punct de date este reprezentat printr-un punct, iar poziția punctului pe axele orizontale și verticale corespunde valorilor celor două variabile.

Diagramele de dispersie sunt instrumente utile pentru identificarea modelelor și tendințelor în date. Adăugarea acestui vizual la rapoartele dvs. LuckyTemplates va adăuga mai multe informații la datele pe care le prezentați. Și până la sfârșitul acestui tutorial, veți putea crea un diagramă de dispersie R care arată astfel:

Graficul de dispersie în scriptul R: Cum se creează și se importă

Această discuție este împărțită în patru pași. Mai întâi veți învăța cum să creați un grafic de dispersie de bază. Apoi, veți aplica o linie netedă pentru a afișa tendința datelor din diagramă. Al treilea și al patrulea pas se concentrează în principal pe teme și modificări de formatare pe care le puteți aplica diagramei de dispersie.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Setul de date folosit în acest exemplu este un tabel care conține numele clientului, durata, câștigurile și rata orară.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Creați diagrama de dispersie de bază în scriptul R Visual

Deschideți .

Pentru a începe, trebuie să aveți trei pachete instalate în programul RStudio , tidyverse , ggthemes și ggpubr .

Dacă nu le aveți instalate, utilizați funcția install.packages( ) . Odată terminat, trebuie să utilizați funcția library( ) pentru a le încărca în mediul R.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Copiați codurile R din bibliotecă și accesați LuckyTemplates. Deschideți editorul R Script și inserați codul. Puteți continua să construiți codul R acolo.

Apoi, utilizați funcția ggplot( ) pentru a crea o diagramă de dispersie. Mai întâi trebuie să specificați setul de date care va fi utilizat în diagramă, prin urmare, comanda baza de date %>% . În acest caz, în locul unei funcții de filtru este utilizat un operator de conductă .

Graficul de dispersie în scriptul R: Cum se creează și se importă

Pentru a specifica setul de date, trebuie să utilizați argumentul aes( ) și apoi să specificați axa x și y. În acest caz, este durata oră și, respectiv, câștigurile. Apoi, utilizați funcția geom_point( ) pentru a afișa punctele pe diagramă.

Puteți face în continuare modificări de formatare a diagramei de dispersie folosind o varietate de funcții, cum ar fi „culoare” sau „formă”. Dacă doriți să aplicați un aspect dinamic diagramei dvs., puteți seta culoarea și dimensiunea punctului la o anumită valoare, așa cum se vede în exemplu.

Când rulați codul, veți obține acest grafic de dispersie în LuckyTemplates. Observați că obțineți cercuri mai mari și de culoare mai închisă atunci când valoarea lor echivalentă a tarifului orar este mai mare.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Adăugați o linie netedă la diagramă

În acest pas următor, veți învăța cum să adăugați o linie netedă la diagramă. O linie netedă este o linie care se potrivește datelor pentru a vă ajuta să explorați potențialele relații dintre două variabile.

Pentru a adăuga o linie netedă, utilizați funcția geom_smooth( ) .

Graficul de dispersie în scriptul R: Cum se creează și se importă

Când rulați scriptul R, graficul de dispersie va arăta astfel. Linia netedă arată acum tendința datelor la un interval de încredere de 95%.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Puteți modifica scara axelor x și y folosind funcțiile scale_x_continuous( ) și scale_y_continuous( ) .

În acest caz, axa y este transformată într-o scară logaritmică, în timp ce axa x rămâne aceeași.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Când rulați codul R, rezultatele vor apărea acum logaritmic. Se schimbă și linia netedă.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Mai mult, deoarece diagrama plasează automat etichete pe axe, le puteți elimina folosind funcția labs( ) .

Graficul de dispersie în scriptul R: Cum se creează și se importă

Graficul de dispersie în scriptul R: Cum se creează și se importă

Formatați aspectul diagramei de dispersie R

După ce ați creat forma de bază a graficului dvs. de dispersie, următorul pas este să personalizați tema și aspectul acesteia.

Utilizați funcția theme( ) pentru a formata diagrama de dispersie în editorul R Script. Și în această funcție, puteți adăuga alte argumente pentru a personaliza.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Panel.grid.major ( ) și panel.grid.minor() vă permit să editați tipul de linie și culoarea liniilor de grilă ale diagramei. Dacă doriți să eliminați o linie de grilă, utilizați funcția element_blank( ) .

Panel.background și plot.background sunt eliminate pentru a face diagrama de dispersie transparentă . Acest lucru vă permite să aveți flexibilitatea de a plasa diagrama oriunde în raport. Dacă doriți să eliminați legenda din diagramă, setați funcția legend.position la „none”.

De asemenea, puteți formata linia și textul axelor x și y. Puteți face linia mai groasă sau mai subțire, sau textul mai mare sau mai mic.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Graficul de dispersie în scriptul R: Cum se creează și se importă

Dacă doriți să aflați despre alte funcții de formatare pe care le puteți utiliza în diagramă, puteți accesa secțiunea Ajutor din RStudio . Introduceți „temă” în bara de căutare și va apărea o listă de funcții de formatare.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Există o varietate de funcții de formatare pe care le puteți utiliza în R. Nu uitați să utilizați ceea ce aveți nevoie și nu exagerați.

Reglați culoarea și intervalul punctelor de date

În ultima secțiune a acestui tutorial, veți învăța cum să formatați scara de culori și intervalul de dimensiuni ale punctelor din diagrama de dispersie.

Funcția scale_colour_viridis_b( ) oferă hărți de culori care sunt perceptive uniforme atât în ​​​​color, cât și în alb-negru. De asemenea, sunt concepute pentru a fi percepute de spectatorii cu forme comune de daltonism.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Dacă îl căutați în secțiunea Ajutor din RStudio, veți vedea diferitele argumente pe care le puteți utiliza pentru a vă formata diagramele. Puteți comuta între opțiuni pentru a afla care rezultat se potrivește cel mai bine raportului dvs.

De exemplu, funcția scale_size_continuous( ) scalează dimensiunea punctelor sau formelor dintr-o diagramă în funcție de o variabilă continuă. Vă permite să specificați dimensiunile minime și maxime ale punctelor care ar trebui utilizate în complot.

În acest caz, 4 este minim, în timp ce 17 este maxim.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Așa arată acum diagrama de dispersie R finală.

Graficul de dispersie în scriptul R: Cum se creează și se importă

Concluzie

În acest tutorial, ați învățat cum să creați un grafic de dispersie R în LuckyTemplates. Un grafic de dispersie este un tip de vizualizare a datelor utilizat pentru a afișa relația dintre două variabile continue. În LuckyTemplates, puteți crea un grafic de dispersie folosind pachetul ggplot și vizualul R Script.

Diagramele de dispersie sunt instrumente utile pentru vizualizarea și identificarea tiparelor și tendințelor din date. Ele sunt utile și pentru identificarea anomaliilor sau anomaliilor.

În general, crearea unui grafic de dispersie în LuckyTemplates folosind R este un proces simplu și vă permite să profitați de capabilitățile puternice de vizualizare a datelor ale pachetului ggplot.

Toate cele bune,

Hossein Seyedagha


Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Cum să salvați și să încărcați un fișier RDS în R

Cum să salvați și să încărcați un fișier RDS în R

Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.

Introducere la filtrarea contextului în LuckyTemplates

Introducere la filtrarea contextului în LuckyTemplates

În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.

Idei de materializare pentru cache-urile de date în DAX Studio

Idei de materializare pentru cache-urile de date în DAX Studio

Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.

Raportare de afaceri folosind LuckyTemplates

Raportare de afaceri folosind LuckyTemplates

Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți