Cosè il sé in Python: esempi del mondo reale
Cos'è il sé in Python: esempi del mondo reale
I grafici delle coordinate parallele sono un utile strumento di visualizzazione utilizzato per mostrare le relazioni tra più variabili che condividono gli stessi dati numerici. In LuckyTemplates, questi grafici vengono creati con un codice Python molto semplice che puoi utilizzare e creare e stilizzare facilmente.
Nel blog di oggi impareremo come creare grafici di coordinate multivariate o parallele utilizzando Python . Seguiremo il processo passo dopo passo, dalla preparazione dei dati alla personalizzazione del grafico per una migliore leggibilità. Puoi guardare il video completo di questo tutorial in fondo a questo blog .
Sommario
Grafici di coordinate parallele in Python: esempio 1
Questa è la nostra prima trama. Mostra le nostre tre variabili: variabile A, B e C e le due linee che rappresentano gli elementi 1 e 2.
Ciò significa che abbiamo due set di dati, uno per l'elemento 1 e un altro per l'elemento 2. E per ogni set di dati, abbiamo le nostre tre variabili.
Diamo un'occhiata ai dati per capire meglio come era strutturata la trama.
Inizia evidenziando il grafico. Fare clic su Dati.
Dovrebbe apparire una tabella con dati molto semplici. È stato creato utilizzando l'opzione Inserisci tabella. Possiamo vedere che nelle colonne ci sono le variabili A, B e C per ogni elemento separato in ogni riga.
Abbiamo dati semplici, ma possiamo trasformarli in qualcosa di molto significativo. Ad esempio, nel nostro grafico, possiamo determinare che la relazione tra i dati è piuttosto "bassa".
Per illustrare, possiamo confrontare questo grafico con i nostri dati. La variabile B nell'elemento 1 è 100 e 115 nell'elemento 2, come mostrato nel grafico.
Possiamo anche identificare come gli elementi e le variabili sono correlati. Ad esempio, possiamo facilmente vedere che la variabile A è inferiore a B e che C è la più bassa tra le tre.
La trama del codice Python
Procediamo ora con il codice Python utilizzato per la trama vera e propria.
Inizia scegliendo oggetto visivo Python dal riquadro Visualizzazioni .
Evidenzia il nostro primo grafico per aprire l' editor di script Python .
Per prima cosa, importiamo matplotlib.pyplot e lo salviamo come variabile plt.
Quindi, introduciamo le funzionalità di pandas.plotting . Pandas funge da libreria per la manipolazione dei dati in LuckyTemplates. Viene utilizzato principalmente per manipolare i dati, ma ha anche funzionalità di tracciamento.
Importiamo parallel_coordinates da pandas.plotting . Parallel_coordinates sarà la funzione principale per la creazione del grafico.
Realizzare la trama in Python
Nella riga 13, documentiamo cosa faremo scrivendo # crea una trama.
Usiamo parallel_coordinates e passiamo il set di dati.
Nella riga 3, possiamo vedere che il set di dati viene creato utilizzando la funzione pandas.DataFrame() . Quindi, aggiungiamo Articolo, Variabile A, Variabile B e Variabile C, che si riflettono quindi nel nostro elenco Valori .
Nella riga 4, il set di dati viene deduplicato utilizzando dataset.drop_duplicates ( ).
Possiamo andare al riquadro Visualizzazioni per vedere i valori che abbiamo aggiunto.
La rimozione di uno qualsiasi di questi valori influirà sulla nostra grafica. Ad esempio, se rimuoviamo la variabile C, le coordinate cambieranno di conseguenza, mostrandoci come funzionano i valori .
Riportiamo la nostra variabile C selezionando la casella accanto ad essa sotto Dati nel riquadro Campi .
Successivamente, passa la funzione parallel_coordinates che accetta alcuni argomenti diversi. Nel nostro caso, prende il set di dati e l' articolo, che fornirà il tipo e la dimensione dal nostro set di dati.
Se rimuoviamo Item dalla nostra funzione e lo eseguiamo, l'oggetto visivo non funzionerà.
Otterremo un errore di script Python che dice che la funzione parallel_coordinates ( ) manca di 1 argomento posizionale richiesto, che è class_column.
Quindi aggiungiamo di nuovo Item . Poiché è posizionale, non è necessario scrivere le coordinate della classe. Possiamo eseguire il codice una volta terminato.
Mostrare la trama in Python
Il passo successivo è mostrare la trama, quindi nella riga 16 documentiamo cosa faremo scrivendo # mostra la trama.
Ricordiamo che abbiamo importato matplotlib.pyplot in precedenza e lo abbiamo salvato come plt. Lo abbiamo fatto perché abbiamo bisogno della funzione plt.show() per mostrare il nostro grafico.
Grafici di coordinate parallele in Python: esempio 2
Il nostro secondo grafico è un set di dati dell'iride che mostra petal_length, petal_width, sepal_length e sepal_width. Ha un po' più di stile rispetto al primo grafico.
Questo set di dati è stato creato con codice Python.
Per visualizzare i nostri dati, fai clic su Trasforma dati e vai a iris_dataset.
Il set di dati contiene colonne per le dimensioni: lunghezza sepalo , larghezza sepalo , lunghezza petalo e larghezza petalo . Ha anche una colonna per il tipo di specie .
Il codice Python del set di dati
I nostri dati sono stati inseriti facilmente utilizzando il codice Python. Vai a Sorgente per mostrare lo script Python.
Il nostro codice Python ha solo due righe. Nella prima riga, abbiamo importato seaborn e lo abbiamo salvato come variabile sns . Abbiamo chiamato il nostro set di dati iris_dataset e utilizzato la variabile sns per caricare il set di dati utilizzando la funzione sns.load_dataset('iris') .
Fare clic su OK per ottenere i dati che abbiamo visto sopra. Naviga tra i dati e, una volta terminato, possiamo chiudere il set di dati andando su Chiudi e applica > Chiudi .
Trame di stile in Python
Per aprire l'editor di script Python per il nostro grafico più stilizzato, fai clic sul nostro secondo grafico.
Iniziamo importando matplotlib.pyplot come plt.
Quindi, usiamo la funzione plt.style.use ('dark_background') per definire lo stile dell'immagine.
Possiamo facilmente personalizzare lo sfondo in base al nostro stile preferito utilizzando il riferimento al foglio di stile di matplotlib . Nel nostro caso, abbiamo utilizzato uno sfondo scuro.
Proviamo anche a utilizzare ggplot , che è uno stile comune utilizzato.
Se lo eseguiamo, ci darà un'immagine simile a questa.
Quindi, carica la funzione pandas per il grafico importando parallel_coordinates da pandas.plotting.
Per creare il grafico, introduciamo il set di dati e impostiamo la nostra specie come classe .
Rispetto al nostro primo grafico, aggiungiamo un parametro aggiuntivo che è la mappa dei colori per ottenere colori diversi. Passalo usando la variabile matplotlib, plt.get_cmap.
Ci sono molte variabili di colore matplotlib tra cui scegliere nel riferimento Colormap di matplotlib .
Ad esempio, attualmente stiamo utilizzando Set 2 dalle mappe di colori qualitative, ma possiamo anche cambiarlo con altri colori, come hsv dalle mappe di colori cicliche.
Fare clic su Esegui per ottenere un grafico simile a questo.
Hsv non ha un bell'aspetto sui nostri dati, ma possiamo giocare finché non troviamo la mappa dei colori più adatta per la nostra trama.
Correlazione Python: guida alla creazione
di set di dati visivi in Panda con ProfileReport() | Funzione Python in LuckyTemplates
Seaborn in Python per visualizzare la distribuzione di una variabile
Conclusione
In questo tutorial, abbiamo coperto le basi della creazione di grafici di coordinate parallele in Python. Abbiamo seguito il processo di preparazione dei dati, creazione del grafico e personalizzazione del grafico per una migliore leggibilità.
I grafici di coordinate parallele sono un potente strumento per la visualizzazione di dati ad alta dimensione e possono essere utilizzati in una varietà di campi tra cui finanza, ingegneria e apprendimento automatico. Ora che sappiamo come creare grafici di coordinate parallele in Python , possiamo iniziare a usarli per comprendere e visualizzare meglio i nostri dati.
Ti auguro il meglio,
Gaelim Olanda
Cos'è il sé in Python: esempi del mondo reale
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.
Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.
In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.
Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.
Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.
Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.
Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.
Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere