Ce este Sinele în Python: Exemple din lumea reală
Ce este Sinele în Python: Exemple din lumea reală
În acest tutorial, veți afla despre Power Query Language Flow și câteva dintre cele mai bune practici ale acestuia. De asemenea, veți învăța cum să vă transformați datele cu ușurință pentru a obține cele mai bune rezultate posibile. Transformările datelor vă vor optimiza raportul și îl vor face să arate convingător.
Cuprins
Setați tipuri de date fără flux de limbă Power Query
Transformările minime pe care ar trebui să le efectuați întotdeauna sunt redenumirea și setarea tipurilor de date pentru coloanele dvs.
Tipurile de date sunt folosite pentru a clasifica valorile în M . O pictogramă lângă numele coloanei arată tipul de date atribuit unui câmp. În acest exemplu de tabel, puteți vedea o pictogramă ABC123 lângă numele coloanelor. Această pictogramă reprezintă orice tip de date care indică faptul că nu a fost atribuit un tip de date acelei coloane.
Dintre cărți, detectarea automată a tipului este activată. Acest lucru generează automat pași de tip modificat în interogările dvs. Chiar dacă este activat, asigurați-vă întotdeauna că Power Query ghicește corect tipurile de date pentru fiecare dintre coloanele din toate tabelele.
Pentru a activa sau dezactiva acea setare, urmați acești pași.
Sub opțiunea Global , puteți selecta una dintre cele trei opțiuni de detectare a tipului disponibile pentru dvs.
Sub opțiunea Fișier curent, puteți comuta opțiunile pentru Detectarea tipului, în funcție de setarea globală.
Setați tipurile de date utilizând fila Transformare
Interfața cu utilizatorul oferă mai multe moduri de a seta tipuri de date pentru coloanele dvs. În secțiunea Orice coloană a filei Transformare, veți găsi butonul Detectare tip de date .
Dacă selectați toate coloanele și faceți clic pe acel buton, acesta va seta automat tipurile de date pentru toate coloanele. Cu toate acestea, deoarece scanează doar primele 200 de rânduri, trebuie totuși să validați dacă Power Query are tipul de date corect.
Dacă selectați o coloană din tabel, puteți vedea tipul ei de date în secțiunea Orice coloană.
Dacă faceți clic pe butonul derulant și selectați Text, pictograma din coloana selectată se va schimba de la ABC123 la doar ABC .
Veți vedea apoi un pas de tip modificat în panoul Pași aplicați.
În fila Acasă, veți găsi și opțiunea de a seta tipul de date.
Setați tipurile de date utilizând antetul coloanei
O altă modalitate este să faceți clic dreapta pe un antet și să selectați Schimbare tip . De acolo, puteți alege tipul de date adecvat pentru coloanele dvs.
Setați tipurile de date folosind pictogramele coloane
Cea mai obișnuită modalitate de a seta tipuri de date este să faceți clic pe pictograma de lângă numele coloanei. Vă va afișa toate tipurile de date disponibile.
În tabelul exemplu, setați tipul de date al coloanei OrderDate la Data .
În funcție de tipul de date al coloanei pe care o selectați, Power Query oferă un set de transformări și opțiuni care se aplică acelui tip de date specific în fila Transformare , fila Adăugare coloană și secțiunea Filtru inteligent .
Deci, dacă selectați o coloană de dată și accesați fila Transformare, veți vedea opțiuni sub butonul Data.
Cu toate acestea, dacă selectați o coloană de text, opțiunile de sub butonul Data nu vor mai fi disponibile.
Pentru filtrarea inteligentă, coloanele de text au filtre de text, iar coloanele de dată au filtre de dată.
Pentru următoarea coloană, schimbați numele coloanei în Cheie client și tipul de date în Număr întreg .
Apoi, modificați tipul de date al coloanelor Canal, Cod valutar și Cod depozit la Text.
După aceea, schimbați numele Indexului regiunii de livrare în Cheia regiunii de livrare și tipul său de date în Număr întreg . Apoi, procedați la fel pentru coloanele Index de descriere a produsului și Cantitate comandă .
În cele din urmă, pentru coloanele Preț unitar, Total linie și Cost unitar, setați tipul de date la Număr zecimal fix .
Setați tipuri de date cu Power Query Language Flow
Din cauza modificărilor din coloane, au fost creați o mulțime de pași în panoul Pași aplicați. Problema este că, din cauza efectuării aceluiași tip de transformări de mai multe ori, interogarea tabelului eșantion devine ineficientă. Acesta este ceva ce trebuie evitat.
Pentru a face interogarea eficientă, încercați să creați un singur pas prin aplicarea acelei transformări specifice tuturor coloanelor înainte de a crea un alt pas.
Duplicați interogarea tabelului exemplu și redenumiți-o Best Practice . În panoul Pași aplicați, faceți clic dreapta pe prima transformare efectuată în interogarea anterioară și selectați Ștergeți până la sfârșit . Apoi, confirmați ștergerea pasului în caseta de dialog Delete Step .
În plus, iată câteva dintre cele mai bune practici. Primul lucru este să creați parametri care să conțină locația sursei de date. Acest lucru facilitează rezolvarea problemelor atunci când numele unui fișier a fost schimbat.
Pentru a crea parametri, faceți clic pe Gestionare parametrii în fila Acasă și selectați Parametru nou .
O altă modalitate este să faceți clic dreapta pe panoul de interogare și să selectați Parametru nou .
După aceea, va apărea o casetă de dialog Manage Parameters . Denumiți parametrul FileLocation și setați Type la Text. Pentru Valorile sugerate, setați-o la Listă de valori, astfel încât să puteți lipi șirul și să modificați sau să adăugați mai multe locații pe care le puteți comuta între ele.
Apoi, accesați File Explorer și selectați fișierul. Copiați calea și inserați parametrii. Odată terminat, apăsați OK .
Reveniți la interogarea Cele mai bune practici și faceți clic pe pasul Sursă din panoul Pași aplicați. Apoi, modificați calea fișierului codificată în bara de formule cu FileLocation .
Eliminați coloanele inutile
Eliminați toate coloanele inutile pentru a economisi spațiu și pentru a îmbunătăți performanța. Aduceți numai datele de care aveți nevoie, deoarece adăugarea tabelelor și coloanelor este mult mai ușoară decât a le elimina.
Cel mai simplu mod de a face acest lucru este prin pasul Alegeți coloanele din fila Acasă. Dacă faceți clic pe acel buton, va apărea o casetă de dialog care vă permite să alegeți coloanele pe care să le păstrați. Ar trebui să vă proiectați și să modelați tabelele cu un scop specific pentru a se potrivi cel mai bine analizei pe care urmează să o efectuați.
De acolo, deselectați coloanele de care nu aveți nevoie în tabel. Pentru acest exemplu de tabel, cardinalitatea coloanei OrderNumber este mare. Cel mai bine este să deselectați acea coloană, deoarece aceasta afectează dimensiunea fișierului și performanța generală.
Dacă nu aveți nevoie de date despre locație pentru analiza eșantionului de interogare, este mai bine să deselectați și Indexul regiunii de livrare . În cele din urmă, deoarece tabelul are deja un preț unitar și o cantitate, coloana Line Total nu este necesară.
După deselectarea coloanelor, apăsați OK . Dacă doriți să modificați selecția coloanei, ștergeți pictograma roată de lângă numele pasului din panoul Pași aplicați.
Atribuiți tipuri de date adecvate coloanelor și limitați rândurile
Apoi, atribuiți tipuri de date pentru toate coloanele. Selectați toate coloanele și faceți clic pe Detectare tip de date în fila Transformare.
Detectare tip de date detectează automat tipurile de date ale coloanelor pe baza scanării primelor 200 de rânduri. Deci, verificați și asigurați-vă că Power Query setează tipurile de date corecte.
Este cea mai bună practică să limitați numărul de rânduri. Dacă exercițiul financiar începe la 1 iulie, puteți omite datele din iunie sau puteți configura un parametru.
Cu toate acestea, există o problemă dacă doriți să puteți modifica valoarea unui parametru în serviciul LuckyTemplates . După ce vă publicați raportul, valorile parametrilor trebuie să fie fie de tip Text, fie de tip Decimal.
Pentru a face față acestui lucru, creați un filtru pentru date făcând clic pe butonul drop-down din coloana OrderDate. Apoi, faceți clic pe Filtre de dată și selectați După .
În caseta de dialog, modificați primul parametru la este după sau egal cu și apoi introduceți data. În acest exemplu, data introdusă a fost 1 iulie 2014.
După ce apăsați OK , filtrul va fi aplicat în tabelul dvs. Apoi, creați un parametru și denumiți-l DatesFrom . Setați Tipul la Text și introduceți data în parametrul Valoare curentă.
Acum, reveniți la interogarea Cele mai bune practici și înlocuiți #date intrinsecă cu Date.From(DatesFrom) .
Făcând clic pe semnul de verificare fără funcția Date.From va returna o eroare. Acest lucru se datorează faptului că DatesFrom este un tip Text, în timp ce câmpul are un tip Date. Funcția Date.From convertește Text în Data.
Redenumiți toate coloanele care nu vor fi ascunse în modelul de date. Numele trebuie să fie concis, auto-descriere și ușor de utilizat. Rețineți că proiectați un model de date pentru persoanele care vor folosi raportul dvs.
Consolidați pașii redundanți în fluxul limbajului Power Query
Următorul lucru de făcut este să consolidați pașii redundanți (cum ar fi redenumirea, eliminarea și modificarea tipurilor de date ale coloanei). Mai mult, pași precum reordonarea coloanelor sunt lucruri la care ar trebui să fii atent atunci când cauți redundanțe.
Tabelele pe care le încărcați în modelul de date nu sunt niciodată afișate în raport. Asta face ca ordinea coloanei să fie irelevantă.
O altă practică bună este să redenumiți pașii în panoul Pași aplicați. Numele pașilor sunt auto-descriere și sunt folosite ca variabile în codul M.
Numele care conțin spații sau caractere speciale sunt scrise folosind notația citată. Înseamnă că numele sunt incluse într-un set de ghilimele duble și au semnul hash sau lire sterline în fața lor, ceea ce face codul M greu de citit. Puteți omite spațiile sau puteți pune un caracter de subliniere între ele.
Adăugarea de detalii suplimentare ale documentației prin introducerea de comentarii în fereastra Editor avansat este, de asemenea, o practică bună în Power Query. Puteți face acest lucru și în Descrierea proprietății pasului . Acestea sunt afișate sub formă de adnotări cu explicații atunci când treceți cu mouse-ul peste un pas cu un semn de exclamare în panoul Pași aplicați.
A ști de ce ați făcut o anumită alegere în dezvoltarea inițială este extrem de util atunci când trebuie să revedeți un fișier după ceva timp. Pentru a adăuga detalii ale documentației, faceți clic dreapta pe un pas din panoul Pași aplicați și selectați Proprietăți .
Va apărea o casetă de dialog Step Properties unde puteți scrie motivul pentru filtrare sau transformare.
Organizați interogări pentru un flux mai bun de limbă Power Query
Una dintre cele mai comune bune practici în Power Query este organizarea interogărilor . Creați foldere pentru parametri, funcții, interogări de pregătire și interogări care vor fi încărcate în modelul de date. În acest exemplu, selectați interogările FileLocation și DatesFrom și faceți clic dreapta pe ele. Apoi, selectați Mutare în grup și faceți clic pe Grup nou .
Apoi, adăugați un nume pentru interogările selectate și apăsați OK .
După gruparea interogărilor, panoul de interogări va arăta astfel.
Pentru toate interogările dvs. de pregătire, asigurați-vă că dezactivați încărcarea debifând Activarea încărcării.
Un alt lucru de discutat în acest tutorial este fluxul de limbă. Fiecare dintre pașii din panoul Pași aplicați transformă o valoare pe care o puteți vedea când faceți clic pe ei.
Datele inițiale au venit și au început în pasul Navigare, iar coloanele au fost selectate. Apoi, tipurile de date au fost modificate și a fost setat un interval de date. De asemenea, coloanele au fost redenumite.
Toți pașii returnează o valoare de tip tabel. Dacă deschideți fereastra Editor avansat, veți vedea o expresie let și o clauză in . Între ele, există o listă de pași sau nume de variabile cu expresii atribuite acestora.
Interogarea returnează orice urmează clauzei in care se referă la pasul final din lista de variabile. Motorul M va urma apoi lanțul de dependență înapoi de la clauza in pentru a elimina tot ceea ce este inutil și pentru a împinge transformările înapoi la sursă, dacă este posibil.
Rezumatul fluxului de limbaj Power Query
Dacă te uiți la formulă, poți vedea fluxul pașilor efectuati în interogare. Veți vedea, de asemenea, funcțiile utilizate de interfața cu utilizatorul în fiecare pas.
Primul pas care a fost făcut în interogare a fost selectarea coloanei. Când pasul a fost efectuat folosind interfața cu utilizatorul, a fost apelată funcția Table.SelectColumns . Ca prim parametru, a luat un tabel care face referire la numele variabilei pasului anterior. Apoi, a listat toate numele coloanelor selectate.
Al doilea pas a transformat tipurile de coloane apelând funcția Table.TransformColumnTypes . Primul său parametru numit rezultatul pasului anterior. Apoi a enumerat un set de liste de transformare.
Al treilea pas setează un filtru de interval de date utilizând funcția Table.SelectRows . A luat o interogare de tip tabel ca prim argument. În acest exemplu, a făcut referire la rezultatul pasului de modificare a tipului.
Ultimul pas a redenumit coloanele folosind funcția Table.RenameColumns . Rezultatul pasului anterior a fost folosit ca prim argument. Apoi, a enumerat un set de liste de redenumire.
Toate funcțiile aplicate prin interfața utilizator încep cu cuvântul Tabel . Toți au luat o valoare de tabel ca prim parametru și apoi au transformat acea valoare.
Deși codul arată secvențial deoarece fiecare pas se referă la pasul anterior, secvența nu este necesară. Dacă mutați un pas, interogarea va rula în continuare, deoarece motorul M urmează întotdeauna lanțul de dependențe.
A avea interfață cu utilizatorul este convenabil, dar se va presupune întotdeauna că doriți să transformați rezultatele transformării anterioare. În cele mai multe cazuri, probabil că acest lucru va fi adevărat și, dacă nu este, va trebui să actualizați manual acea valoare de referință din cod.
Tipuri și conectori de date Power Query
Seturi de date LuckyTemplates: tipuri și convenții de denumire
Cele mai bune practici de încărcare și transformare a datelor
Concluzie
Transformarea datelor este necesară pentru a vă păstra datele grupate și organizate. Face dezvoltarea datelor mai rapidă, deoarece puteți urmări cu ușurință problemele din fluxul de limbaj Power Query și puteți modifica modificările din raportul dvs.
Melissa
Ce este Sinele în Python: Exemple din lumea reală
Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.
În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.
Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.
În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.
Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.
Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.
Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.
Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.
Ce este LuckyTemplates Gateway? Tot ce trebuie să știți