Evaluarea și optimizarea performanței codului în R

Evaluarea și optimizarea performanței codului în R

Optimizarea codului R poate îmbunătăți semnificativ performanța scripturilor și programelor R, făcându-le să ruleze mai eficient. Acest lucru este deosebit de important pentru seturi de date mari și complexe, precum și pentru aplicațiile care trebuie să fie rulate în timp real sau în mod regulat.

În acest tutorial , vom evalua și optimiza performanța unui cod R folosind diferite pachete R , cum ar fi tidyverse și data.table. De exemplu, vom vedea cât timp durează RStudio să citească un fișier CSV mare folosind funcția read.csv ( ) , pachetul tidyverse și pachetul data.table.

Cuprins

Optimizarea performanței în R

Deschide RStudio. În scriptul R, atribuiți extensia fișierului unei variabile.

Trebuie să utilizați funcția system.file ( ) pentru a determina cât timp durează executarea unei funcții sau operații. Deoarece vrem să evaluăm cât timp durează deschiderea unui fișier, scrieți read.csv (df) în argument.

Evaluarea și optimizarea performanței codului în R

Când rulați codul, Consola vă va arăta timpul necesar pentru a deschide fișierul. Coloana scursă arată cât timp a durat CPU-ului să execute codul R. Rezultatele arată că a durat RStudio 31,93 secunde, ceea ce este o perioadă semnificativă de timp. Acest timp de încărcare nu este practic dacă lucrați întotdeauna cu seturi de date mari.

Evaluarea și optimizarea performanței codului în R

Una dintre modalitățile prin care puteți optimiza performanța codului dvs. R este prin utilizarea pachetului tidyverse . Procedând astfel, timpul reduce de la 30 la 5 secunde.

Rețineți că pentru a citi fișierul, trebuie să utilizați funcția read_csv ( ) .

Evaluarea și optimizarea performanței codului în R

Pachetul tidyverse îmbunătățește timpul de încărcare în R prin utilizarea pachetului readr , care oferă un set de funcții rapide și eficiente pentru citirea și scrierea datelor. Pachetul readr oferă funcții precum read_csv ( ) și read_table ( ) care pot citi seturi mari de date rapid și eficient.

O altă metodă de optimizare în R este utilizarea pachetului data.table . Acesta poate fi descărcat gratuit de pe internet.

Pachetul data.table din R este un instrument puternic și eficient pentru lucrul cu seturi de date mari și complexe. Acesta oferă o versiune îmbunătățită a obiectului data.frame, care este o structură de bază de date în R. Principalul avantaj al data.table este performanța ridicată și utilizarea redusă a memoriei atunci când lucrați cu seturi de date mari.

Rețineți că atunci când utilizați acest pachet, trebuie să scrieți funcția fread ( ) în loc de read.csv ( ). Când rulați acest lucru împreună cu codul dvs., puteți vedea că timpul de încărcare este redus la 2,25 secunde.

Evaluarea și optimizarea performanței codului în R

Compararea pachetelor R folosind Microbenchmark

Pentru a compara performanța dintre fiecare metodă, puteți utiliza funcția microbenchmark ( ) .

Funcția microbenchmark ( ) din R este un instrument pentru măsurarea performanței codului R. Oferă o interfață simplă și ușor de utilizat pentru evaluarea timpului de execuție al expresiilor R.

Un lucru grozav la această funcție este că puteți seta de câte ori se repetă procesul. Acest lucru oferă rezultate mai precise. De asemenea, puteți identifica dacă rezultatele sunt consecvente.

Evaluarea și optimizarea performanței codului în R

Dacă întâmpinați probleme la citirea unui fișier CSV în LuckyTemplates, RStudio o poate face pentru dvs. Există și alte opțiuni în R pe care le puteți folosi pentru a optimiza performanța codului. Dar data.table este foarte recomandat din cauza simplității sale.

Concluzie

Optimizarea codului R este un pas important pentru a vă asigura că scripturile dvs. R rulează eficient. Există mai multe tehnici și instrumente care pot fi utilizate pentru a optimiza codul R, cum ar fi utilizarea pachetului tidyverse pentru manipularea datelor, utilizarea pachetului data.table pentru seturi mari de date și utilizarea pachetului microbenchmark pentru măsurarea performanței codului R.

De asemenea, este important să țineți cont de bunele practici de codare, cum ar fi utilizarea operațiunilor vectorizate în loc de bucle, utilizarea funcțiilor încorporate în loc să le scrieți pe ale dvs. și să fiți atenți la utilizarea memoriei codului dvs.

Toate cele bune,

George Mount


Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Cum să salvați și să încărcați un fișier RDS în R

Cum să salvați și să încărcați un fișier RDS în R

Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.

Introducere la filtrarea contextului în LuckyTemplates

Introducere la filtrarea contextului în LuckyTemplates

În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.

Idei de materializare pentru cache-urile de date în DAX Studio

Idei de materializare pentru cache-urile de date în DAX Studio

Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.

Raportare de afaceri folosind LuckyTemplates

Raportare de afaceri folosind LuckyTemplates

Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți