Ce este Sinele în Python: Exemple din lumea reală
Ce este Sinele în Python: Exemple din lumea reală
Graficele de coordonate paralele sunt un instrument de vizualizare util folosit pentru a afișa relațiile dintre mai multe variabile care partajează aceleași date numerice. În LuckyTemplates, aceste diagrame sunt create cu un cod Python foarte simplu pe care îl puteți utiliza și puteți crea și stiliza cu ușurință.
În blogul de astăzi, vom învăța cum să creăm diagrame de coordonate multivariate sau paralele folosind Python . Vom parcurge procesul pas cu pas, de la pregătirea datelor până la personalizarea diagramei pentru o mai bună lizibilitate. Puteți viziona videoclipul complet al acestui tutorial în partea de jos a acestui blog .
Cuprins
Grafice de coordonate paralele în Python: Exemplul 1
Acesta este primul nostru complot. Afișează cele trei variabile ale noastre - variabilele A, B și C și cele două linii care reprezintă elementele 1 și 2.
Asta înseamnă că avem două seturi de date, unul pentru Itemul 1 și altul pentru Itemul 2. Și pentru fiecare set de date, avem cele trei variabile ale noastre.
Să ne uităm la date pentru a înțelege mai bine cum a fost structurat intriga.
Începeți prin a evidenția graficul. Faceți clic pe Date.
Ar trebui să apară un tabel cu date foarte simple. A fost creat folosind opțiunea de inserare tabel. Putem vedea că în coloane sunt variabile A, B și C pentru fiecare element care sunt separate în fiecare rând.
Avem date simple, dar le putem transforma în ceva foarte grăitor. De exemplu, în graficul nostru, putem determina că relația dintre date este destul de „scăzută”.
Pentru a ilustra, putem compara acest grafic cu datele noastre. Variabila B din articolul 1 este 100 și 115 în articolul 2, așa cum se arată în grafic.
De asemenea, putem identifica modul în care elementele și variabilele sunt legate. De exemplu, putem observa cu ușurință că variabila A este mai mică decât B și că C este cea mai mică dintre cele trei.
Codul Python Plot
Să continuăm acum cu codul Python folosit pentru diagrama reală.
Începeți prin a alege vizual Python din panoul Vizualizări .
Evidențiați primul nostru grafic pentru a deschide editorul de script Python .
Mai întâi, importăm matplotlib.pyplot și îl salvăm ca plt variabilă.
Apoi, aducem funcțiile pandas.plotting . Pandas servește ca o bibliotecă de manipulare a datelor în LuckyTemplates. Este folosit în principal pentru a manipula date, dar are și caracteristici de plotare.
Să importăm parallel_coordinates din pandas.plotting . Parallel_coordinates va fi funcția principală pentru crearea graficului.
Realizarea complotului în Python
În rândul 13, documentăm ceea ce vom face scriind # make a plot.
Folosim parallel_coordinates și trecem în setul de date.
În linia 3, putem vedea că setul de date este creat folosind funcția pandas.DataFrame ( ) . Apoi, adăugăm Item, Variable A, Variable B și Variable C, care sunt apoi reflectate în lista noastră de Valori .
În linia 4, setul de date este deduplicat folosind dataset.drop_duplicates ( ).
Putem merge la panoul Vizualizări pentru a vedea Valorile pe care le-am adăugat.
Eliminarea oricăreia dintre aceste valori va afecta imaginile noastre. De exemplu, dacă eliminăm variabila C, coordonatele se vor schimba în consecință, arătându-ne cum funcționează Valorile .
Să readucem variabila C bifând caseta de lângă ea sub Date în panoul Câmpuri .
Apoi, introduceți funcția parallel_coordinates care ia câteva argumente diferite. În cazul nostru, este nevoie de setul de date și elementul, care va furniza tipul și dimensiunea din setul nostru de date.
Dacă eliminăm elementul din funcția noastră și îl rulăm, vizualul nu va funcționa.
Vom primi o eroare de script Python care spune că funcției parallel_coordinates ( ) lipsește 1 argument pozițional necesar, care este class_column.
Deci, să adăugăm elementul înapoi. Deoarece este pozițional, nu trebuie să scriem coordonatele clasei. Putem rula codul odată terminat.
Afișează complotul în Python
Următorul pas este să arătăm diagrama, așa că în rândul 16, documentăm ceea ce vom face scriind # show the plot.
Amintiți-vă că am importat matplotlib.pyplot mai devreme și l-am salvat ca plt. Am făcut asta pentru că avem nevoie de funcția plt.show( ) pentru a ne afișa diagrama.
Grafice de coordonate paralele în Python: Exemplul 2
Al doilea grafic al nostru este un set de date iris care arată petal_length, petal_width, sepal_length și sepal_width. Are un pic mai mult stil în comparație cu primul grafic.
Acest set de date a fost creat cu cod Python.
Pentru a vizualiza datele noastre, faceți clic pe Transformare date și accesați iris_dataset.
Setul de date conține coloane pentru dimensiuni: lungimea sepalului , lățimea sepalului , lungimea petalei și lățimea petalei . De asemenea, are o coloană pentru tipul de specie .
Codul Python al setului de date
Datele noastre au fost introduse cu ușurință folosind codul Python. Accesați Sursă pentru a afișa scriptul Python.
Codul nostru Python are doar două linii. În prima linie, am importat seaborn și l-am salvat ca sns variabil . Am numit setul nostru de date iris_dataset și am folosit variabila sns pentru a încărca setul de date folosind funcția sns.load_dataset('iris') .
Faceți clic pe OK pentru a obține datele pe care le-am văzut mai sus. Navigați prin date și, odată terminat, putem închide setul de date accesând Închidere și aplicație > Închidere .
Stilizarea parcelelor în Python
Pentru a deschide editorul de script Python pentru graficul nostru mai stilizat, faceți clic pe al doilea diagramă.
Începem prin a importa matplotlib.pyplot ca plt.
Apoi, folosim funcția plt.style.use ('dark_background') pentru a stila imaginea.
Putem personaliza cu ușurință fundalul pe baza stilului nostru preferat folosind referința pentru foaia de stil de la matplotlib . În cazul nostru, am folosit un fundal întunecat.
Să încercăm, de asemenea, să folosim ggplot , care este un stil comun folosit.
Dacă îl rulăm, ne va oferi o imagine care arată astfel.
Apoi, încărcați funcția panda pentru grafic importând parallel_coordinates din pandas.plotting.
Pentru a realiza graficul, aducem setul de date și setăm specia noastră ca clasă .
În comparație cu primul nostru grafic, adăugăm un parametru suplimentar care este harta de culori pentru a obține culori diferite. Transmiteți asta folosind variabila matplotlib, plt.get_cmap.
Există o mulțime de variabile de culoare matplotlib din care să alegeți în referința Colormap a matplotlib .
De exemplu, în prezent folosim Setul 2 din hărți de culori calitative, dar îl putem schimba și cu alte culori, cum ar fi hsv din hărți de culori ciclice.
Faceți clic pe Run pentru a obține un complot care arată astfel.
Hsv nu arată foarte bine pe datele noastre, dar ne putem juca până când găsim cea mai potrivită hartă de culori pentru parcela noastră.
Corelație Python: Ghid pentru crearea
seturilor de date vizuale în Pandas cu ProfileReport() | Funcția Python în LuckyTemplates
Seaborn în Python pentru a vizualiza distribuția unei variabile
Concluzie
În acest tutorial, am acoperit elementele de bază ale creării de diagrame de coordonate paralele în Python. Am trecut prin procesul de pregătire a datelor, de creare a graficului și de personalizare a graficului pentru o mai bună lizibilitate.
Graficele de coordonate paralele sunt un instrument puternic pentru vizualizarea datelor cu dimensiuni mari și pot fi utilizate într-o varietate de domenii, inclusiv finanțe, inginerie și învățare automată. Acum că știm cum să creăm diagrame de coordonate paralele în Python , putem începe să le folosim pentru a înțelege și a vizualiza mai bine propriile noastre date.
Toate cele bune,
Olanda Gaelim
Ce este Sinele în Python: Exemple din lumea reală
Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.
În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.
Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.
În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.
Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.
Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.
Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.
Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.
Ce este LuckyTemplates Gateway? Tot ce trebuie să știți