Cosè il sé in Python: esempi del mondo reale
Cos'è il sé in Python: esempi del mondo reale
In questo blog imparerai come applicare codici o funzioni ripetibili ai set di dati Python per produrre lo stesso tipo di output. Ciò ti aiuterà a essere più efficiente e ad esercitare meno sforzi nel recuperare determinati dati da diversi set di dati. In questo tutorial, utilizzeremo un codice esistente che ho precedentemente creato come esempio.
Imparerai anche come creare copie di set di dati per evitare di danneggiare la versione originale del set di dati, importare librerie e funzioni utilizzando codici ripetibili e creare una visualizzazione in LuckyTemplates .
Per questo blog, ti consiglio di ottenere sempre il file CSV e portarlo su LuckyTemplates. Dimostrerò anche come possiamo portare questo file CSV e inserirlo direttamente in LuckyTemplates, nel caso tu debba farlo.
Sommario
Recupero di un file CSV in LuckyTemplates
Per portare un file CSV in LuckyTemplates, la prima cosa che devi fare è fare clic sul menu " Ottieni dati " nella barra multifunzione Home .
Dopo aver fatto clic, verrà visualizzato un menu a discesa e dovrai selezionare l'opzione " Testo/CSV " dal menu.
Una volta selezionata l'opzione " Testo/CSV ", si aprirà una finestra in cui possiamo selezionare il file che vogliamo portare in LuckyTemplates. Per questo esempio, utilizziamo il file IMDB Dataset .
All'apertura del file IMDB Dataset.csv , vedrai un'altra finestra che mostra i dati all'interno di quel file. Poiché questo file contiene una grande quantità di dati, ne visualizza solo l'anteprima.
La prima cosa che faremo in questo file è trasformarlo. Per farlo, fai clic sull'opzione " Trasforma dati " nella parte in basso a destra della finestra.
Fare una copia del set di dati Python
Prima di apportare modifiche a questo set di dati, è importante creare una copia del set di dati originale. Per fare ciò, fai clic con il pulsante destro del mouse sul set di dati.
Quindi dal menu, seleziona " Copia ".
Infine, fai clic con il pulsante destro del mouse sul pannello Query , quindi seleziona " Incolla " dalle opzioni.
Dopo aver applicato questi passaggi, dovresti avere una copia del set di dati IMDB originale nel pannello Query .
Trasformare un set di dati eseguendo uno script Python
Trasformando un file CSV, sarai in grado di suddividere grandi quantità di set di dati Python in set di dati più piccoli. Possiamo farlo applicando alcuni script Python in questo file.
Ma prima, dobbiamo assicurarci che le intestazioni siano correttamente allineate. Fai clic sul menu Home , quindi cerca l'opzione " Usa la prima riga come intestazione " e fai clic su di essa.
Dopo aver fatto clic sull'opzione " Usa prima riga come intestazioni ", le intestazioni ora sono cambiate nei dati delle prime righe precedenti che sono " revisione " e " sentimento ".
Successivamente, vai al menu Trasforma e fai clic sull'opzione " Esegui script Python " nel gruppo di opzioni " Script ".
Successivamente, verrà visualizzata una finestra " Esegui script Python ". In questa finestra, puoi eseguire qualsiasi script Python che desideri per trasformare il file corrente che stai utilizzando. Per questo esempio, ridurrò il set di dati eseguendo il codice seguente.
Ho utilizzato la funzione .iloc sul set di dati per selezionare le righe e le colonne specifiche dal set di dati IMDB. Quindi, nei parametri, ho selezionato tutte le prime 500 righe e tutte le colonne nel set di dati IMDB. L'ho memorizzato in una variabile denominata " dataset ".
Dopo aver eseguito lo script, dovremmo vedere il "dataset" che è la variabile che abbiamo creato nel passaggio precedente. Contiene i dati che abbiamo modificato utilizzando lo script Python.
Controllo del set di dati
Per aprire la tabella del set di dati , è sufficiente fare clic su " Tabella " nella colonna Valore .
Possiamo vedere che questo set di dati è ora ridotto a 500 righe .
Ora che abbiamo suddiviso il nostro set di dati Python in 500 righe, la prossima cosa che faremo è importare le librerie di cui abbiamo bisogno. Lo faremo usando la stessa procedura che abbiamo fatto per alterare il contenuto del set di dati IMDB. Questo per garantire che il nostro codice possa essere gestibile in determinati scenari con meno modifiche.
Importazione di librerie e funzioni utilizzando codici ripetibili
Per importare le librerie, torniamo al nostro taccuino e copiamo le librerie che ci servono. Tieni presente che prima di questo tutorial, ho già creato queste librerie che stiamo per copiare. Sto solo riutilizzando questi per farti avere un'idea chiara dell'uso delle funzioni come codici ripetibili.
Una volta copiate le librerie, incollale nella finestra " Esegui script Python " e non dimenticare di includere la riga " from collections import Counter " alla fine dello script.
Quindi copieremo la funzione di pulizia dei dati dal nostro notebook e la aggiungeremo allo script Python in LuckyTemplates.
Lo aggiungeremo sotto le librerie.
Copiamo anche il codice per chiamare la funzione che abbiamo appena aggiunto.
Quindi incollalo nello script Python in LuckyTemplates.
Generazione di tabelle di dati
Ora che abbiamo aggiunto il codice per chiamare la funzione di pulizia dei dati , dobbiamo cambiare " df2 " in " dataset " e " title " in " review ". Lo abbiamo fatto a causa delle modifiche apportate al set di dati.
Abbiamo cambiato "df2" in " dataset " perché abbiamo memorizzato i dati con 500 righe in "dataset". Quindi per "titolo", lo abbiamo aggiornato in "revisione" come risultato della modifica delle intestazioni delle colonne.
Con questi codici aggiunti, dovremmo essere in grado di ottenere o generare 3 tabelle che sono data1 per la frequenza delle parole, data2 per la frequenza del bigramma e data3 per la frequenza del trigramma.
Puoi anche creare un'altra copia di questo set di dati IMDB modificato (2) per aprire un'altra tabella in un secondo momento.
Ora in IMDB Dataset (2) , apriamo la data1 table .
Una volta aperta la tabella data1 , possiamo vedere l'elenco delle parole e la frequenza.
Come puoi vedere, siamo in grado di eseguire determinate procedure dal set di dati principale con l'uso di codici ripetibili che abbiamo preso dal Jupyter Notebook. Con quei codici ripetibili, siamo in grado di trasformare un set di dati Python e generare una tabella per la frequenza delle parole, la frequenza dei bigrammi e la frequenza dei trigrammi senza digitare nuovamente i codici.
In IMDB Dataset (3) , apriamo la tabella data2 per vedere la frequenza del bigramma.
Nella tabella delle frequenze del bigramma, puoi vedere il " br " incluso nell'elenco. Questo è probabilmente collegato a un codice HTML. Possiamo semplicemente tornare indietro e aggiungere qualcos'altro, ma non lo faremo in questo tutorial.
Ora che i dati sono stati caricati con l'aiuto dei codici ripetibili, possiamo iniziare a visualizzarli in LuckyTemplates. Ad esempio, un grafico a barre per la frequenza di ogni parola.
Funzioni definite dall'utente Python | Una panoramica
dell'elenco Python e dei cicli for in LuckyTemplates
Utilizzo di Python in LuckyTemplates | Set di dati e funzione di stringa
Conclusione
Per riassumere, i codici ripetibili possono aiutarti a eseguire determinate procedure su un set di dati con meno sforzo. Hai imparato come utilizzare codici ripetibili per trasformare un set di dati Python in LuckyTemplates. È stato anche possibile utilizzare la funzione .iloc per specificare le righe e le colonne da selezionare durante la modifica di un set di dati.
Inoltre, hai creato copie di set di dati e creato una visualizzazione utilizzando un grafico a barre. Questa visualizzazione si basa sui set di dati Python che abbiamo creato e modificato con l'aiuto di codici ripetibili.
Ti auguro il meglio,
Gaellim
Cos'è il sé in Python: esempi del mondo reale
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.
Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.
In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.
Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.
Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.
Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.
Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.
Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere