Ce este Sinele în Python: Exemple din lumea reală
Ce este Sinele în Python: Exemple din lumea reală
În acest tutorial, voi demonstra cum puteți transforma datele stivuite dezordonate într-un format mai organizat. Există o modalitate destul de ușoară de a face acest lucru și este una care va fi incredibil de utilă și are o mulțime de aplicații diferite. Vom folosi modulo Power Query. Puteți viziona videoclipul complet al acestui tutorial în partea de jos a acestui blog.
Soția mea a coborât în birou și a spus că a copiat o grămadă de adrese dintr-o invitație din calendar și a ajuns să se lipească în acest format. Ea avea 28 de adrese de e-mail și nume care au ajuns în acest tip de format ciudat, stivuite. Era o listă de nume cu o grămadă de ghilimele, virgule, mesaje nedorite și adrese de e-mail. Ea a vrut să știe cum să folosească Power Query pentru a-l aduce într-un format mai bun.
Deci, să trecem la Power Query și vom vedea datele brute. Să păstrăm intacte datele brute și să le facem referire. Vom numi acest fișier de referință, TestData .
Primul lucru pe care îl vom face este să adăugăm un index și nu prea contează pentru aceste scopuri dacă este un indice bazat pe zero sau un index bazat pe unul. Vom folosi doar un index bazat pe zero pentru această demonstrație. Este ușor să faceți clic fără a fi nevoie să treceți prin alte opțiuni.
Acest lucru va implica un pivot, deoarece un pivot preia rânduri și le transformă în coloane. În acest caz, dorim să luăm acest set de rânduri și să le transformăm în trei coloane - una pentru prenume, una pentru numele de familie și una pentru adresa de e-mail.
Le vom pivota pe cele din coloane, dar trebuie să avem o modalitate prin care pivotul să știe ce element intră în ce coloană. Aici intervine Power Query Modulo.
Cuprins
Gestionarea datelor stivuite folosind Power Query Modulo
Modulo ne oferă restul atunci când împărțim un anumit număr. Pentru a accesa Modulo, mergem la fila Adăugare coloană, apoi vom găsi Standard, facem clic pe săgeata drop-down și derulăm în jos.
Când facem clic pe Modulo, ne oferă o casetă pop-up care ne solicită numărul de coloane pe care le dorim. În acest caz, vrem trei coloane.
Dacă împărțim trei la trei, obținem unul cu restul de zero. Trei în patru dă un rest de unu, trei în cinci dă restul de doi și apoi trei în șase ne dă restul de zero. Deci, produce acest model repetat frumos pe care îl putem folosi pentru pivotul nostru.
Dar înainte de a face asta, să curățăm datele. Există două moduri în care putem face acest lucru. Una este că putem înlocui pur și simplu valorile. De exemplu, pentru ghilimele, putem pune doar citatul acolo și apoi îl înlocuim cu nimic. Va elimina și va curăța aceste ghilimele.
Cealaltă modalitate de a face acest lucru, în care îl putem curăța și salva câțiva pași, este folosind o funcție numită Text.Remove . Mai întâi, adăugăm o coloană personalizată, apoi listăm toate valorile de care dorim să scăpăm.
După cum puteți vedea, asta șterge totul frumos și ușor. Și așa, acum putem scăpa de acea coloană inițială și apoi mutam acea coloană personalizată.
Acum ne putem face pivotul curat. Luăm Modulo, mergem la Transformare, apoi Pivot Column și vom pivota pe Custom, dar nu vrem ca acesta să fie agregat. Deci, vom alege Nu agregați și vom face clic pe OK.
Îl înlocuim cu aceste valori în coloană. Apoi creează acele trei coloane pentru noi. Putem vedea numele de familie, prenumele și adresa de e-mail acolo, dar nu este exact formatul pe care îl dorim.
Pentru a remedia acest lucru, putem lua aceste coloane și apoi facem o completare .
Și acum avem aceste rânduri suplimentare din cauza modelului repetat al Modulo.
Putem scăpa cu ușurință de asta eliminând rândurile alternative. Putem face asta în opțiunea Eliminați rândurile.
Putem spune că primul rând de eliminat este doi. Apoi îndepărtați al doilea și al treilea rând, apoi păstrați al patrulea și faceți asta ca un model care se repetă.
Acum puteți vedea că avem toate datele corecte curățate într-un mod frumos și încă mai avem cele 28 de adrese de e-mail originale.
Acum putem scăpa de coloana Index și putem redenumi în consecință anteturile coloanei.
Modul LuckyTemplates și funcții DAX cu împărțire întregi
Cele mai bune practici de interogare de putere pentru modelul dvs. de date
Interogare de putere M: model alternativ 0-1 în tabelul de date
Concluzie
Puteți vedea că doar cu trucul Modulo și apoi pivotând datele și cu puțină curățare, este destul de ușor de făcut. Odată ce înțelegi, probabil că durează doar un minut pentru a face totul.
Deci, sperăm că acest lucru ți-a oferit mai multe idei și instrumente. De asemenea, puteți consulta următorul meu tutorial . În acest sens, vom arunca o privire suplimentară asupra unora dintre lucrurile pe care le-am acoperit în acest tutorial și, de asemenea, vom vedea cum putem automatiza acest proces într-un mod repetabil, folosind funcții personalizate. Îți voi arăta câteva trucuri interesante pentru depanarea funcțiilor personalizate.
Sper că ați găsit asta de ajutor. Puteți viziona videoclipul complet de mai jos și puteți consulta linkurile de mai jos pentru mai mult conținut similar.
Toate cele bune!
Ce este Sinele în Python: Exemple din lumea reală
Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.
În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.
Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.
În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.
Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.
Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.
Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.
Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.
Ce este LuckyTemplates Gateway? Tot ce trebuie să știți