Come caricare set di dati di esempio in Python

Come caricare set di dati di esempio in Python

In questo post, vedremo come caricare set di dati di esempio in Python. Questo potrebbe non sembrare l'argomento più affascinante, ma in realtà è piuttosto importante. Idealmente, avrai alcuni set di dati in Python su cui puoi esercitarti quando impari nuovi concetti. Puoi guardare il video completo di questo tutorial in fondo a questo blog.

Se hai intenzione di condividere il tuo codice , documentare ciò che hai fatto o hai bisogno di aiuto , è davvero una buona idea utilizzare un set di dati generalmente disponibile per creare qualcosa che viene chiamato un esempio minimamente riproducibile .

Avrai un codice o uno script pre-raggruppato che qualcun altro su Internet può eseguire e aiutarti con esso. Se non produci questi esempi minimamente riproducibili , verrai infiammato in posti come Stack Overflow, il che può essere un po' uno shock se non lo conosci.

Come caricare set di dati di esempio in Python

Diamo un'occhiata ad alcuni modi per creare questi esempi minimamente riproducibili e ottenere i set di dati. Ci sono alcuni pacchetti che puoi usare per caricare un set di dati premade in Python e condividere quel codice.

Esamineremo tre pacchetti che sono i più comuni. Accendiamo un taccuino Jupyter vuoto e iniziamo.

Come caricare set di dati di esempio in Python

Sommario

Carica set di dati in Python da Sklearn

Il primo che vedremo si chiama Sklearn . Se stai usando Anaconda, non avrai bisogno di scaricarlo. Se desideri ulteriore assistenza con Python, LuckyTemplates ha un a cui puoi iscriverti.

Presumo che tu sappia già cose come i pacchetti e parti da lì. Introdurremo panda e Sklearn, in particolare il sottomodulo del set di dati.

Come caricare set di dati di esempio in Python

Porteremo alcuni di questi set di dati. Scikit-learn , una libreria di dati di apprendimento automatico, li chiama set di dati giocattolo. Caricheremo Boston, che è un set di dati sui prezzi delle case. Quando lo introduciamo, dobbiamo averlo come frame di dati.

Dobbiamo effettivamente specificare che i dati e le colonne provengono dal set di dati Scikit-learn e separare le variabili delle caratteristiche e le variabili di destinazione.

Come caricare set di dati di esempio in Python

Lo inseriremo come frame di dati in modo da poter operare e fare cose diverse con esso. Panda è un ottimo pacchetto da conoscere come utente di LuckyTemplates.

Carica set di dati in Python dai set di dati Vega

Un'altra opzione che possiamo imparare è il pacchetto di set di dati Vega. Questo non è disponibile su Anaconda ma possiamo installarlo tramite PIP. Questo è ciò che digiteremo sulla riga di comando per installare i set di dati Vega e per installare o importare il modulo dati locale.

Come caricare set di dati di esempio in Python

Alcuni di questi li puoi effettivamente ottenere, ma avrai bisogno di una connessione web. Porteremo quelli installati localmente importando i dati locali ed eseguendoli.

Come caricare set di dati di esempio in Python

Come puoi vedere, ci sono parecchi set di dati. Alcuni di questi sono serie temporali, mentre altri hanno variabili categoriche o continue. Scegliamo il set di dati delle auto in un frame di dati in modo da poter eseguire il metodo head su di esso.

Come caricare set di dati di esempio in Python

Ora abbiamo un altro set di dati di esempio che possiamo utilizzare e condividere.

Come caricare set di dati di esempio in Python

Carica set di dati in Python da Seaborn

Seaborn è un altro pacchetto disponibile nella distribuzione Anaconda. Per impostazione predefinita, Seaborn è meglio conosciuto per la visualizzazione dei dati, ma ha anche alcuni fantastici set di dati di esempio che puoi utilizzare. Questo è ciò che digiteremo per ottenere i set di dati.

Come caricare set di dati di esempio in Python

Come puoi vedere, ci sono parecchi set di dati qui. Andremo avanti e utilizzeremo il set di dati dei pinguini e otterremo di nuovo le prime righe.

Come caricare set di dati di esempio in Python

Il risultato è un altro set di dati su cui esercitarci.

Come caricare set di dati di esempio in Python

L'idea qui non è solo quella di avere i set di dati su cui esercitarsi. Se vediamo alcuni valori mancanti, abbiamo problemi a eliminare i set di dati, vogliamo inserire la variabile categoriale o mostrare un esempio ad altre persone senza fornire alcuni dati sensibili, puoi semplicemente utilizzare uno di questi set di dati accessibili pubblicamente che sono davvero, davvero facili per le persone da usare e condividere. Questa è l'idea di un esempio minimamente riproducibile.

LuckyTemplates con script Python per creare tabelle di date
Python in LuckyTemplates: come installare e configurare
Python I per gli utenti di LuckyTemplates: nuovo corso nella piattaforma educativa LuckyTemplates

Conclusione

Per ricapitolare, ci sono tre posizioni in cui cercare set di dati di esempio. Scikit-learn è un pacchetto di apprendimento automatico. È un po' più difficile da convertire, ma se stai facendo cose legate all'apprendimento automatico, questo è il posto dove andare. I set di dati Vega hanno anche un buon numero di set di dati, specialmente se si utilizza il metodo per ottenere set di dati dal Web, ma è relativamente più difficile da caricare, quindi è sufficiente utilizzare PIP anziché averlo preinstallato con Anaconda. Seaborn è il punto debole perché carica il frame di dati e ha molta versatilità quando si tratta di utilizzare set di dati di esempio ed esempi riproducibili.

Stack Overflow ha anche un tutorial su come scrivere un buon esempio minimamente riproducibile o MRE, quindi dai un'occhiata se stai cercando di pubblicare qualcosa online.

Sapere dove ottenere buoni set di dati e condividere un buon MRE è un'abilità davvero importante da avere come analista.

Se ti sono piaciuti i contenuti trattati in questo particolare tutorial, iscriviti al canale TV LuckyTemplates. Abbiamo un'enorme quantità di contenuti che escono continuamente da me e da una serie di creatori di contenuti, tutti dedicati a migliorare il modo in cui utilizzi LuckyTemplates e Power Platform.


Power Automate si applica a ogni azione nei flussi di lavoro

Power Automate si applica a ogni azione nei flussi di lavoro

Scopri l

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.

Filtro Power Apps: cosè e come si usa?

Filtro Power Apps: cosè e come si usa?

Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Connettori Power Automate: numero, testo e data e ora

Connettori Power Automate: numero, testo e data e ora

Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Ora, è molto facile studiare il budget rispetto all

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.

Che cosè Power Query e M Language: una panoramica dettagliata

Che cosè Power Query e M Language: una panoramica dettagliata

Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.

Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.