Cosè il sé in Python: esempi del mondo reale
Cos'è il sé in Python: esempi del mondo reale
MultiIndex in Pandas è un oggetto multilivello o gerarchico che ti consente di selezionare più di una riga e colonna nel tuo indice. Consente inoltre di creare sofisticate analisi e manipolazione dei dati, in particolare per lavorare con dati dimensionali superiori. In questo tutorial, esplorerò la funzionalità MultiIndex di Pandas. Puoi guardare il video completo di questo tutorial in fondo a questo blog.
L'idea qui è che abbiamo un indice che contiene anche una gerarchia. Se hai già utilizzato Pandas, sai che i frame di dati di Pandas contengono un index , quindi aggiungeremo ulteriori livelli a questo. Ciò renderà più semplice sia l'indicizzazione che il rimodellamento dei dati, a seconda che tu abbia effettivamente una gerarchia per i tuoi dati.
Ad esempio, utilizzeremo il famoso set di dati Gapminder, e questo è davvero un MultiIndex qui. Abbiamo una gerarchia, quindi un continente analizza i paesi e ogni paese può analizzare più anni. Quindi, possiamo manipolare questo indice e le cose saranno molto più facili da codificare quando useremo questo MultiIndex. Vedremo sezionare e anche rimodellare il set di dati di Gapminder.
Sommario
Come utilizzare il MultiIndex nei panda
Useremo il set di dati di Gapminder. Se non lo hai installato, vuoi fare un'installazione PIP Gapminder. Porterò anche i panda. Sto usando la distribuzione Anaconda di Python. In tal caso, Pandas verrà già installato. Facciamo un'importazione Gapminder, e poi daremo un'occhiata a questi dati.
Come puoi vedere qui, ancora una volta abbiamo un indice o una gerarchia. Dovrei dire che abbiamo un continente, un paese e poi un anno. Al momento, l'indice è solo numerico come questo, e ora imposteremo il nostro indice. E il modo in cui lo faremo è con Gapminder. Imposteremo l'indice. Lo imposteremo su continente, paese e poi anno, inplace equals ( = ) true .
Questo sta solo salvando i risultati, quindi non dobbiamo chiamare la variabile due volte, solo un po' più efficiente. E ora vedrai che qui abbiamo l'indice (contenuto, paese, anno) e questo è il nostro multi-indice.
Un paio di cose che potremmo fare qui. Diciamo, ad esempio, che volevo tutto nel continente europeo. Voglio filtrare o affettare questo frame di dati. Posso usare gapminder.loc e quindi digitare Europe. Potresti avere familiarità con loc. Da altre circostanze in Panda, funziona molto più facilmente quando lo facciamo in base all'indice.
Ora questo esiste in una gerarchia. Diciamo che volevamo solo i dati dal Regno Unito. Sembra che saremmo in grado di suddividerlo, ma questo sarà un problema perché quando indicizziamo questo, siamo bloccati nell'usare la gerarchia. Dobbiamo iniziare con il primo livello, quindi approfondire il secondo e il terzo, eccetera.
Se volessi includere più livelli, quello che posso fare è passarlo qui. Farò l'Europa e poi il Regno Unito. Potrei anche fare un ulteriore passo avanti e mettere 1997. E ora, possiamo vedere qui il risultato di quella riga in quel caso.
Un'altra cosa interessante con MultiIndex in Pandas è che è molto più facile rimodellare i dati. Posso fare gapminder_pivot e poi gapminder.unstack . Se devo rimodellare questo set di dati, per qualche motivo, lo stamperò e vedrai che ora abbiamo il continente, il paese e poi l'anno insieme alle colonne.
Ora, diciamo che volevo farlo nella direzione opposta. Tutto quello che dovrei fare è unpivot e faremo gapminder_pivot . Se si trattava di disimpilare, allora si tratta di impilare gapminder_unpivot.
Ora, cosa succede se voglio sbarazzarmi di questo indice e ripristinarlo e cambiarlo in qualcos'altro? Tutto quello che devo fare in questo caso è gapminder_unpivot. Stiamo andando a reset_index . Lo faremo di nuovo sul posto . Non dobbiamo salvare su se stesso. È solo un po' più efficiente. Quindi, gapminder_unpivot.
Stampalo e torniamo ai nostri dati originali e abbiamo l'indice. L'inizio numerico è a zero perché Python è un'indicizzazione in base zero.
Python in LuckyTemplates: come installare e configurare
gli script Python nei report sui dati di LuckyTemplates
LuckyTemplates con script Python per creare tabelle di date
Conclusione
Pandas è stato inizialmente chiamato dopo i dati del pannello. È davvero pensato per funzionare con i dati panel, che sono un tipo specifico di dati di serie temporali con più categorie. In tal caso, avere una gerarchia ha davvero senso, giusto?
Funziona davvero bene se lavori con righe univoche, cercando di trovare più colonne.
Per quanto riguarda le prestazioni, potrebbe essere che l'indice non sia necessario se stai unendo, ma non ci stavamo unendo qui. Stavamo solo operando, accedendo, indicizzando, rimodellando, ecc. Tuttavia, l'efficienza della codifica è sicuramente un grande vantaggio.
Quindi questo è tutto per MultiIndex in Pandas. Spero che questo sia qualcosa che puoi usare. Oggi hai imparato qualcosa di nuovo sui Panda.
Ti auguro il meglio!
Cos'è il sé in Python: esempi del mondo reale
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.
Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.
In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.
Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.
Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.
Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.
Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.
Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere