Setul de date Python: aplicarea codurilor repetabile

În acest blog, veți învăța cum să aplicați coduri sau funcții repetabile la seturile de date Python pentru a produce același tip de ieșire. Acest lucru vă va ajuta să fiți mai eficient și să depuneți mai puțin efort în extragerea anumitor date din diferite seturi de date. În acest tutorial, vom folosi un cod existent pe care l-am creat anterior ca exemplu.

De asemenea, veți învăța cum să faceți copii ale setului de date pentru a evita deteriorarea versiunii originale a setului de date, să importați biblioteci și funcții folosind coduri repetabile și să creați o vizualizare în LuckyTemplates .

Pentru acest blog, vă recomand să obțineți fișierul CSV tot timpul și să îl aduceți la LuckyTemplates. De asemenea, voi demonstra cum putem aduce acest fișier CSV și îl plasăm direct în LuckyTemplates, în cazul în care trebuie să o faceți.

Cuprins

Preluarea unui fișier CSV în LuckyTemplates

Pentru a aduce un fișier CSV în LuckyTemplates, primul lucru pe care trebuie să-l faceți este să faceți clic pe meniul „ Obțineți date ” din panglica Acasă .

Setul de date Python: aplicarea codurilor repetabile

După ce faceți clic, va apărea un meniu derulant și trebuie să selectați opțiunea „ Text/CSV ” din meniu.

Setul de date Python: aplicarea codurilor repetabile

Odată ce selectați opțiunea „ Text/CSV ”, se va deschide o fereastră în care putem selecta fișierul pe care dorim să îl aducem în LuckyTemplates. Pentru acest exemplu, să folosim fișierul IMDB Dataset

Setul de date Python: aplicarea codurilor repetabile

La deschiderea fișierului IMDB Dataset.csv , veți vedea o altă fereastră care afișează datele din acel fișier. Deoarece acest fișier conține o cantitate mare de date, previzualizează doar unele dintre date.

Primul lucru pe care îl vom face în acest fișier este să-l transformăm. Pentru a face acest lucru, faceți clic pe opțiunea „ Transformare date ” din partea dreaptă jos a ferestrei.

Setul de date Python: aplicarea codurilor repetabile

Realizarea unei copii a setului de date Python

Înainte de a face modificări acestui set de date, este important să facem o copie a setului de date original. Pentru a face acest lucru, faceți clic dreapta pe setul de date. 

Setul de date Python: aplicarea codurilor repetabile

Apoi, din meniu, selectați „ Copiere ”.

Setul de date Python: aplicarea codurilor repetabile

În cele din urmă, faceți clic dreapta pe panoul Interogări , apoi selectați „ Lipire ” din opțiuni.

Setul de date Python: aplicarea codurilor repetabile

După aplicarea acestor pași, ar trebui să aveți o copie a setului de date IMDB original în panoul Interogări .

Setul de date Python: aplicarea codurilor repetabile

Transformarea unui set de date prin rularea unui script Python

Prin transformarea unui fișier CSV, veți putea împărți cantități mari de seturi de date Python în altele mai mici. Putem face asta aplicând un script Python în acest fișier.

Dar mai întâi, trebuie să ne asigurăm că anteturile sunt aliniate corect. Faceți clic pe meniul Acasă , apoi căutați opțiunea „ Utilizați primul rând ca antete ” și faceți clic pe ea.

Setul de date Python: aplicarea codurilor repetabile

După ce ați făcut clic pe opțiunea „ Utilizați primul rând ca antete ”, anteturile s-au schimbat acum în datele de pe primele rânduri anterioare, care sunt „ revizuire ” și „ sentiment ”.

Setul de date Python: aplicarea codurilor repetabile

Apoi, accesați meniul Transformare și faceți clic pe opțiunea „ Rulați Script Python din grupul de opțiuni „ Scripturi ”.

Setul de date Python: aplicarea codurilor repetabile

După aceea, va apărea o fereastră „ Run Script Python ”. În această fereastră, puteți rula orice script Python dorit pentru a transforma fișierul curent pe care îl utilizați. Pentru acest exemplu, voi face setul de date mai mic rulând următorul cod.

Setul de date Python: aplicarea codurilor repetabile

Am folosit funcția .iloc de pe setul de date pentru a selecta rândurile și coloanele specifice din setul de date IMDB. Apoi, în parametri, am selectat toate primele 500 de rânduri și toate coloanele din setul de date IMDB. L-am stocat într-o variabilă numită „ dataset ”.

După executarea scriptului, ar trebui să vedem „setul de date”, care este variabila pe care am creat-o în pasul anterior. Conține datele pe care le-am modificat folosind scriptul Python.

Setul de date Python: aplicarea codurilor repetabile

Verificarea setului de date

Pentru a deschide tabelul setului de date , faceți clic pe „ Tabel din coloana Valoare .

Setul de date Python: aplicarea codurilor repetabile

Putem vedea că acest set de date este acum redus la 500 de rânduri .

Setul de date Python: aplicarea codurilor repetabile

Acum că ne-am împărțit setul de date Python în 500 de rânduri, următorul lucru pe care îl vom face este să importam bibliotecile de care avem nevoie. Vom face asta folosind aceeași procedură pe care am făcut-o la modificarea conținutului setului de date IMDB. Acest lucru este pentru a ne asigura că codul nostru poate fi gestionabil în anumite scenarii cu mai puține modificări.

Importul biblioteci și funcții folosind coduri repetabile

Pentru a importa bibliotecile, să ne întoarcem la caietul nostru și să copiem bibliotecile de care avem nevoie. Rețineți că înainte de acest tutorial, am creat deja aceste biblioteci pe care urmează să le copiam. Le reutilizam doar pentru a vă face o idee clară despre utilizarea funcțiilor ca coduri repetabile.

Setul de date Python: aplicarea codurilor repetabile

Odată ce bibliotecile sunt copiate, lipiți-le în fereastra „ Run Python Script ” și nu uitați să includeți linia „ din colecții import Counter ” la sfârșitul scriptului. 

Setul de date Python: aplicarea codurilor repetabile

Apoi vom copia funcția de curățare a datelor din blocnotes și o vom adăuga la scriptul Python din LuckyTemplates.

Setul de date Python: aplicarea codurilor repetabile

Îl vom adăuga sub biblioteci. 

Setul de date Python: aplicarea codurilor repetabile

Vom copia, de asemenea, codul pentru apelarea funcției pe care tocmai am adăugat-o.

Setul de date Python: aplicarea codurilor repetabile

Apoi lipiți-l în scriptul Python în LuckyTemplates.

Setul de date Python: aplicarea codurilor repetabile

Generarea tabelelor de date

Acum că am adăugat codul pentru apelarea funcției de curățare a datelor , trebuie să schimbăm „ df2 ” în „ set de date ” și „ titlul ” în „ revizuire ”. Am făcut acest lucru datorită modificărilor pe care le-am făcut în setul de date.

Am schimbat „df2” în „ dataset ” deoarece am stocat datele cu 500 de rânduri în „dataset”. Apoi, pentru „titlu”, l-am actualizat la „revizuire” ca urmare a modificării antetelor coloanelor.

Cu aceste coduri adăugate, ar trebui să putem obține sau genera 3 tabele care sunt data1 pentru frecvența cuvintelor, data2 pentru frecvența bigramelor și data3 pentru frecvența trigramelor.

Setul de date Python: aplicarea codurilor repetabile

De asemenea, puteți face o altă copie a acestui set de date IMDB modificat (2) pentru a deschide un alt tabel mai târziu.

Setul de date Python: aplicarea codurilor repetabile

Acum, în IMDB Dataset (2) , să deschidem tabelul data1

Setul de date Python: aplicarea codurilor repetabile

 Odată deschis tabelul data1 , putem vedea lista de cuvinte precum și frecvența.

Setul de date Python: aplicarea codurilor repetabile

După cum puteți vedea, putem efectua anumite proceduri din setul de date principal cu utilizarea codurilor repetabile pe care le-am luat din Jupyter Notebook. Cu aceste coduri repetabile, putem transforma un set de date Python și genera un tabel pentru frecvența cuvintelor, frecvența bigramelor și frecvența trigramelor fără a introduce codurile din nou.

În set de date IMDB (3) , să deschidem tabelul data2 pentru a vedea frecvența bigramelor.

Setul de date Python: aplicarea codurilor repetabile

În tabelul de frecvență bigram, puteți vedea „ br ” inclus în listă. Acesta este probabil conectat la un cod HTML. Putem pur și simplu să ne întoarcem și să adăugăm altceva, dar nu vom face asta în acest tutorial.

Acum că datele au fost încărcate cu ajutorul codurilor repetabile, putem începe să facem vizualizări despre acestea în LuckyTemplates. De exemplu, un grafic cu bare pentru frecvența fiecărui cuvânt. 

Setul de date Python: aplicarea codurilor repetabile


Funcții definite de utilizator Python | Prezentare generală
a listei Python și a buclelor For în LuckyTemplates
folosind Python în LuckyTemplates | Set de date și funcție șir

Concluzie

Pentru a rezuma, codurile repetabile vă pot ajuta să efectuați anumite proceduri pe un set de date cu mai puțin efort. Ați învățat cum să utilizați coduri repetabile pentru a transforma un set de date Python în LuckyTemplates. De asemenea, ați putut să utilizați funcția .iloc pentru a specifica rândurile și coloanele care trebuie selectate la modificarea unui set de date.

În plus, ați creat copii ale seturilor de date și ați creat o vizualizare folosind un grafic cu bare. Această vizualizare se bazează pe seturile de date Python pe care le-am creat și modificat cu ajutorul codurilor repetabile.

Toate cele bune,

Gaellim

Leave a Comment

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Ce este Sinele în Python: Exemple din lumea reală

Cum să salvați și să încărcați un fișier RDS în R

Cum să salvați și să încărcați un fișier RDS în R

Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

Primele N zile lucrătoare revizuite – O soluție de limbaj de codare DAX

În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Prezentați perspective utilizând tehnica vizuală dinamică cu mai multe fire în LuckyTemplates

Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.

Introducere la filtrarea contextului în LuckyTemplates

Introducere la filtrarea contextului în LuckyTemplates

În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Cele mai bune sfaturi pentru utilizarea aplicațiilor din serviciul online LuckyTemplates

Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Analizați modificările marjei de profit ore suplimentare – Analytics cu LuckyTemplates și DAX

Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.

Idei de materializare pentru cache-urile de date în DAX Studio

Idei de materializare pentru cache-urile de date în DAX Studio

Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.

Raportare de afaceri folosind LuckyTemplates

Raportare de afaceri folosind LuckyTemplates

Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți

Ce este LuckyTemplates Gateway? Tot ce trebuie să știți