Power Automate si applica a ogni azione nei flussi di lavoro
Scopri l
In questo post, vedremo come caricare set di dati di esempio in Python. Questo potrebbe non sembrare l'argomento più affascinante, ma in realtà è piuttosto importante. Idealmente, avrai alcuni set di dati in Python su cui puoi esercitarti quando impari nuovi concetti. Puoi guardare il video completo di questo tutorial in fondo a questo blog.
Se hai intenzione di condividere il tuo codice , documentare ciò che hai fatto o hai bisogno di aiuto , è davvero una buona idea utilizzare un set di dati generalmente disponibile per creare qualcosa che viene chiamato un esempio minimamente riproducibile .
Avrai un codice o uno script pre-raggruppato che qualcun altro su Internet può eseguire e aiutarti con esso. Se non produci questi esempi minimamente riproducibili , verrai infiammato in posti come Stack Overflow, il che può essere un po' uno shock se non lo conosci.
Diamo un'occhiata ad alcuni modi per creare questi esempi minimamente riproducibili e ottenere i set di dati. Ci sono alcuni pacchetti che puoi usare per caricare un set di dati premade in Python e condividere quel codice.
Esamineremo tre pacchetti che sono i più comuni. Accendiamo un taccuino Jupyter vuoto e iniziamo.
Sommario
Carica set di dati in Python da Sklearn
Il primo che vedremo si chiama Sklearn . Se stai usando Anaconda, non avrai bisogno di scaricarlo. Se desideri ulteriore assistenza con Python, LuckyTemplates ha un a cui puoi iscriverti.
Presumo che tu sappia già cose come i pacchetti e parti da lì. Introdurremo panda e Sklearn, in particolare il sottomodulo del set di dati.
Porteremo alcuni di questi set di dati. Scikit-learn , una libreria di dati di apprendimento automatico, li chiama set di dati giocattolo. Caricheremo Boston, che è un set di dati sui prezzi delle case. Quando lo introduciamo, dobbiamo averlo come frame di dati.
Dobbiamo effettivamente specificare che i dati e le colonne provengono dal set di dati Scikit-learn e separare le variabili delle caratteristiche e le variabili di destinazione.
Lo inseriremo come frame di dati in modo da poter operare e fare cose diverse con esso. Panda è un ottimo pacchetto da conoscere come utente di LuckyTemplates.
Carica set di dati in Python dai set di dati Vega
Un'altra opzione che possiamo imparare è il pacchetto di set di dati Vega. Questo non è disponibile su Anaconda ma possiamo installarlo tramite PIP. Questo è ciò che digiteremo sulla riga di comando per installare i set di dati Vega e per installare o importare il modulo dati locale.
Alcuni di questi li puoi effettivamente ottenere, ma avrai bisogno di una connessione web. Porteremo quelli installati localmente importando i dati locali ed eseguendoli.
Come puoi vedere, ci sono parecchi set di dati. Alcuni di questi sono serie temporali, mentre altri hanno variabili categoriche o continue. Scegliamo il set di dati delle auto in un frame di dati in modo da poter eseguire il metodo head su di esso.
Ora abbiamo un altro set di dati di esempio che possiamo utilizzare e condividere.
Carica set di dati in Python da Seaborn
Seaborn è un altro pacchetto disponibile nella distribuzione Anaconda. Per impostazione predefinita, Seaborn è meglio conosciuto per la visualizzazione dei dati, ma ha anche alcuni fantastici set di dati di esempio che puoi utilizzare. Questo è ciò che digiteremo per ottenere i set di dati.
Come puoi vedere, ci sono parecchi set di dati qui. Andremo avanti e utilizzeremo il set di dati dei pinguini e otterremo di nuovo le prime righe.
Il risultato è un altro set di dati su cui esercitarci.
L'idea qui non è solo quella di avere i set di dati su cui esercitarsi. Se vediamo alcuni valori mancanti, abbiamo problemi a eliminare i set di dati, vogliamo inserire la variabile categoriale o mostrare un esempio ad altre persone senza fornire alcuni dati sensibili, puoi semplicemente utilizzare uno di questi set di dati accessibili pubblicamente che sono davvero, davvero facili per le persone da usare e condividere. Questa è l'idea di un esempio minimamente riproducibile.
LuckyTemplates con script Python per creare tabelle di date
Python in LuckyTemplates: come installare e configurare
Python I per gli utenti di LuckyTemplates: nuovo corso nella piattaforma educativa LuckyTemplates
Conclusione
Per ricapitolare, ci sono tre posizioni in cui cercare set di dati di esempio. Scikit-learn è un pacchetto di apprendimento automatico. È un po' più difficile da convertire, ma se stai facendo cose legate all'apprendimento automatico, questo è il posto dove andare. I set di dati Vega hanno anche un buon numero di set di dati, specialmente se si utilizza il metodo per ottenere set di dati dal Web, ma è relativamente più difficile da caricare, quindi è sufficiente utilizzare PIP anziché averlo preinstallato con Anaconda. Seaborn è il punto debole perché carica il frame di dati e ha molta versatilità quando si tratta di utilizzare set di dati di esempio ed esempi riproducibili.
Stack Overflow ha anche un tutorial su come scrivere un buon esempio minimamente riproducibile o MRE, quindi dai un'occhiata se stai cercando di pubblicare qualcosa online.
Sapere dove ottenere buoni set di dati e condividere un buon MRE è un'abilità davvero importante da avere come analista.
Se ti sono piaciuti i contenuti trattati in questo particolare tutorial, iscriviti al canale TV LuckyTemplates. Abbiamo un'enorme quantità di contenuti che escono continuamente da me e da una serie di creatori di contenuti, tutti dedicati a migliorare il modo in cui utilizzi LuckyTemplates e Power Platform.
Scopri l
Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.
Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all
Come commentare più righe in Python: una guida semplice e veloce
Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.
Ora, è molto facile studiare il budget rispetto all
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.
Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.
Cos'è il sé in Python: esempi del mondo reale
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.