Cosè il sé in Python: esempi del mondo reale
Cos'è il sé in Python: esempi del mondo reale
In questo post, vedremo come caricare set di dati di esempio in Python. Questo potrebbe non sembrare l'argomento più affascinante, ma in realtà è piuttosto importante. Idealmente, avrai alcuni set di dati in Python su cui puoi esercitarti quando impari nuovi concetti. Puoi guardare il video completo di questo tutorial in fondo a questo blog.
Se hai intenzione di condividere il tuo codice , documentare ciò che hai fatto o hai bisogno di aiuto , è davvero una buona idea utilizzare un set di dati generalmente disponibile per creare qualcosa che viene chiamato un esempio minimamente riproducibile .
Avrai un codice o uno script pre-raggruppato che qualcun altro su Internet può eseguire e aiutarti con esso. Se non produci questi esempi minimamente riproducibili , verrai infiammato in posti come Stack Overflow, il che può essere un po' uno shock se non lo conosci.
Diamo un'occhiata ad alcuni modi per creare questi esempi minimamente riproducibili e ottenere i set di dati. Ci sono alcuni pacchetti che puoi usare per caricare un set di dati premade in Python e condividere quel codice.
Esamineremo tre pacchetti che sono i più comuni. Accendiamo un taccuino Jupyter vuoto e iniziamo.
Sommario
Carica set di dati in Python da Sklearn
Il primo che vedremo si chiama Sklearn . Se stai usando Anaconda, non avrai bisogno di scaricarlo. Se desideri ulteriore assistenza con Python, LuckyTemplates ha un a cui puoi iscriverti.
Presumo che tu sappia già cose come i pacchetti e parti da lì. Introdurremo panda e Sklearn, in particolare il sottomodulo del set di dati.
Porteremo alcuni di questi set di dati. Scikit-learn , una libreria di dati di apprendimento automatico, li chiama set di dati giocattolo. Caricheremo Boston, che è un set di dati sui prezzi delle case. Quando lo introduciamo, dobbiamo averlo come frame di dati.
Dobbiamo effettivamente specificare che i dati e le colonne provengono dal set di dati Scikit-learn e separare le variabili delle caratteristiche e le variabili di destinazione.
Lo inseriremo come frame di dati in modo da poter operare e fare cose diverse con esso. Panda è un ottimo pacchetto da conoscere come utente di LuckyTemplates.
Carica set di dati in Python dai set di dati Vega
Un'altra opzione che possiamo imparare è il pacchetto di set di dati Vega. Questo non è disponibile su Anaconda ma possiamo installarlo tramite PIP. Questo è ciò che digiteremo sulla riga di comando per installare i set di dati Vega e per installare o importare il modulo dati locale.
Alcuni di questi li puoi effettivamente ottenere, ma avrai bisogno di una connessione web. Porteremo quelli installati localmente importando i dati locali ed eseguendoli.
Come puoi vedere, ci sono parecchi set di dati. Alcuni di questi sono serie temporali, mentre altri hanno variabili categoriche o continue. Scegliamo il set di dati delle auto in un frame di dati in modo da poter eseguire il metodo head su di esso.
Ora abbiamo un altro set di dati di esempio che possiamo utilizzare e condividere.
Carica set di dati in Python da Seaborn
Seaborn è un altro pacchetto disponibile nella distribuzione Anaconda. Per impostazione predefinita, Seaborn è meglio conosciuto per la visualizzazione dei dati, ma ha anche alcuni fantastici set di dati di esempio che puoi utilizzare. Questo è ciò che digiteremo per ottenere i set di dati.
Come puoi vedere, ci sono parecchi set di dati qui. Andremo avanti e utilizzeremo il set di dati dei pinguini e otterremo di nuovo le prime righe.
Il risultato è un altro set di dati su cui esercitarci.
L'idea qui non è solo quella di avere i set di dati su cui esercitarsi. Se vediamo alcuni valori mancanti, abbiamo problemi a eliminare i set di dati, vogliamo inserire la variabile categoriale o mostrare un esempio ad altre persone senza fornire alcuni dati sensibili, puoi semplicemente utilizzare uno di questi set di dati accessibili pubblicamente che sono davvero, davvero facili per le persone da usare e condividere. Questa è l'idea di un esempio minimamente riproducibile.
LuckyTemplates con script Python per creare tabelle di date
Python in LuckyTemplates: come installare e configurare
Python I per gli utenti di LuckyTemplates: nuovo corso nella piattaforma educativa LuckyTemplates
Conclusione
Per ricapitolare, ci sono tre posizioni in cui cercare set di dati di esempio. Scikit-learn è un pacchetto di apprendimento automatico. È un po' più difficile da convertire, ma se stai facendo cose legate all'apprendimento automatico, questo è il posto dove andare. I set di dati Vega hanno anche un buon numero di set di dati, specialmente se si utilizza il metodo per ottenere set di dati dal Web, ma è relativamente più difficile da caricare, quindi è sufficiente utilizzare PIP anziché averlo preinstallato con Anaconda. Seaborn è il punto debole perché carica il frame di dati e ha molta versatilità quando si tratta di utilizzare set di dati di esempio ed esempi riproducibili.
Stack Overflow ha anche un tutorial su come scrivere un buon esempio minimamente riproducibile o MRE, quindi dai un'occhiata se stai cercando di pubblicare qualcosa online.
Sapere dove ottenere buoni set di dati e condividere un buon MRE è un'abilità davvero importante da avere come analista.
Se ti sono piaciuti i contenuti trattati in questo particolare tutorial, iscriviti al canale TV LuckyTemplates. Abbiamo un'enorme quantità di contenuti che escono continuamente da me e da una serie di creatori di contenuti, tutti dedicati a migliorare il modo in cui utilizzi LuckyTemplates e Power Platform.
Cos'è il sé in Python: esempi del mondo reale
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.
Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.
In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.
Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.
Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.
Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.
Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.
Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere