Seturi de date în Pandas cu ProfileReport() | Python în LuckyTemplates

Una dintre cele mai frecvente întrebări pe care le veți întâlni în calitate de analist de date este care este cea mai bună modalitate de a explora un anumit set de date. Aceasta este o considerație importantă în primul rând dacă doriți să puneți toate datele împreună într-un raport care va fi ușor de interpretat de dvs. sau de echipa dvs. În acest tutorial, voi demonstra cum puteți explora eficient seturile de date în Pandas folosind ProfileReport(). Puteți viziona videoclipul complet al acestui tutorial în partea de jos a acestui blog.

Când vi se oferă un set de date, ce faceți? Cum explorezi setul de date? În primul rând, dacă doriți să puneți totul laolaltă într-un raport ușor de citit pentru dvs., pentru colegii de muncă etc., aveți o mulțime de lucruri de luat în considerare.

În primul rând, te gândești la ce fel de variabile sunt, deoarece asta va influența modul în care le analizezi și cum le tratezi. Date înseamnă ceea ce este dat. Deci, ceea ce lipsește vor fi datele pe care nu le avem. Un alt lucru este să vizualizezi acele relații. Cum arată ele? Vrem să folosim acea putere de vizualizare devreme și des.

Acestea sunt o mulțime de întrebări complexe interconectate. Lucrul bun este că există această funcție de raportare de profilare disponibilă care ne va oferi acele răspunsuri. Deci, să ne uităm la toate acestea în Python.

Cuprins

Explorați seturile de date în Pandas folosind funcția ProfileReport().

Mai întâi, vom încărca setul de date.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates

Apoi, din pandas_profiling , vom importa acest lucru numit raport de profil. Acum, dacă primești o eroare aici, probabil că trebuie să o instalezi. Eu folosesc Anaconda. Îți sugerez să folosești și asta. Să rulăm asta și apoi să o imprimăm.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates

Deci aici este. Avem o privire de ansamblu . Aceasta ne oferă o defalcare a tipurilor de variabile. Avem statisticile setului de date. Vedem numărul de coloane de rând, așa mai departe și așa mai departe. Lucrul frumos cu acest raport este că este ca un ghișeu unic și, de asemenea, arată foarte frumos. Are o prezentare foarte atrăgătoare.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates

Derulăm în jos aici și avem Variabilele . Obținem o vizualizare și putem comuta mai multe detalii despre variabilă. Avem steaguri care indică lucruri care pot fi puțin neobișnuite. Avem și aceste alerte și multe alte funcții care ne vor oferi mai multe informații. Și, aceasta este pentru fiecare variabilă.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates

Pe măsură ce continuăm să derulăm în jos, vom găsi Interacțiuni, unde sunt create diagrame de dispersie pentru a vizualiza datele.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates

Și apoi, avem Corelații , care a rezumat relația.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates

Urmează valorile lipsă , care sunt foarte importante. După cum puteți vedea, avem câteva valori lipsă aici și vrem să știm de ce. Aceste vizualizări de aici sunt menite să ne ajute să facem asta. Putem face clic pe fiecare imagine și putem analiza datele.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates

În cele din urmă, avem Eșantionul. Am putea obține acest lucru în multe feluri, dar tot ceea ce facem este doar să tipărim primele câteva rânduri, ceea ce este bine de știut.

Seturi de date în Pandas cu ProfileReport() |  Python în LuckyTemplates


MultiIndex în Pandas pentru date pe mai multe niveluri sau ierarhice
Cum se încarcă seturi de date eșantioane în Python
Python în LuckyTemplates: Cum se instalează și se configurează

Concluzie

Așa explorați seturile de date în Pandas folosind funcția ProfileReport(). Există o mulțime de moduri de a tăia și tăia datele. Gândiți-vă la toate combinațiile de permutări ale datelor. Acest lucru nu va putea face totul pentru tine, dar este un început foarte bun.

Când explorăm datele, este într-adevăr un proces iterativ. Nu există nicio pastilă magică atât de mult pe cât ne-am dori una. Cu toate acestea, ProfilerReport() este într-adevăr un instrument grozav. Primim o mulțime de informații și o singură linie de cod. Acesta este un instrument gratuit, așa că sper că îl puteți folosi în propria muncă. Spune-ne cum faci asta.

Toate cele bune!

Leave a Comment

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Cum să salvați și să încărcați un fișier RDS în R

Cum să salvați și să încărcați un fișier RDS în R

Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.

Introducere la filtrarea contextului în LuckyTemplates

Introducere la filtrarea contextului în LuckyTemplates

În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.

Idei de materializare pentru cache-urile de date în DAX Studio

Idei de materializare pentru cache-urile de date în DAX Studio

Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.

Raportare de afaceri folosind LuckyTemplates

Raportare de afaceri folosind LuckyTemplates

Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți