Come aprire un file Excel in Python: passo dopo passo

Come aprire un file Excel in Python: passo dopo passo

Lavorare con i file Excel è un'attività comune nella vita quotidiana di molti professionisti, alcuni di noi lo adorano e altri lo odiano. Tuttavia, Python fornisce diverse librerie per rendere questo processo più semplice, più snello e più efficiente.

Sia la libreria Pandas che openpyxl consentono agli utenti di aprire un file excel in Python. Pandas ha un metodo integrato che lo rende facile, mentre openpyxl è ottimo quando hai bisogno di un maggiore controllo sulla struttura e sulla formattazione del file.

In questo articolo, esploreremo vari metodi per aprire e lavorare con fogli di calcolo in Python utilizzando queste librerie. Con questa conoscenza, sarai in grado di elaborare e analizzare in modo efficiente i dati di Excel utilizzando i potenti strumenti forniti dall'ampio ecosistema di Python!

Come aprire un file Excel in Python: passo dopo passo

Sommario

Quali sono i prerequisiti?

Prima di immergersi nel processo di apertura di un file Excel in Python, ci sono alcuni prerequisiti che devono essere soddisfatti. Innanzitutto, dovresti avere una conoscenza di base della programmazione Python, comprese variabili, funzioni e librerie di importazione.

Questo ti aiuterà a capire e lavorare facilmente con gli esempi di codice forniti nell'articolo.

Oltre alla conoscenza di base di Python, è importante anche l'installazione delle librerie necessarie. Sono disponibili diverse librerie Python per lavorare con i file Excel, tra cui:

  • panda: una potente libreria per la manipolazione dei dati.

  • openpyxl: una popolare libreria per la lettura e la scrittura di file Excel.

  • xlrd: una libreria per la lettura dei dati e la formattazione delle informazioni dai file Excel.

  • xlwt: una libreria per scrivere dati e formattare informazioni su file Excel.

  • xlutils: una suite di strumenti per lavorare con le cartelle di lavoro di Excel, inclusa la lettura, la scrittura e la modifica dei dati.

Per installare una delle librerie di cui sopra usando pip, apri il prompt dei comandi o il terminale e digita il seguente comando, sostituendo ` library_name` con la libreria desiderata:

pip install 

Un altro prerequisito cruciale è avere un foglio di calcolo Excel con cui lavorare. Dovresti preparare una cartella di lavoro Excel contenente i dati che desideri manipolare con Python.

È possibile scaricare cartelle di lavoro di esempio da Microsoft e altri siti di tutorial.

Sebbene il file possa avere più fogli e varie formattazioni, è consigliabile iniziare con un semplice set di dati per il processo di apprendimento iniziale. Puoi affrontare fogli di calcolo complessi una volta acquisita maggiore esperienza e comprensione delle librerie in uso.

Come aprire un file Excel in Python: passo dopo passo

Come installare le librerie richieste

Per lavorare con fogli di calcolo Excel in Python, è necessario installare le librerie appropriate. Ci sono diverse librerie disponibili per questo scopo, ma due delle più popolari sono openPyXL e xlrd .

OpenPyXL è una libreria Python che consente di leggere e scrivere file Excel (in particolare file xltm, xlsm, xltx e xlsx). Non richiede l'installazione di Microsoft Excel e funziona su tutte le piattaforme. Per installare OpenPyXL usando pip, esegui il seguente comando nel tuo terminale:

pip install openpyxl

D'altra parte, xlrd è un'altra libreria ampiamente utilizzata per leggere dati e formattare informazioni da file Excel. Supporta specificamente i formati di file xls e xlsx.

Per installare xlrd usando pip, esegui il seguente comando nel tuo terminale:

pip install xlrd

Una volta installata la libreria desiderata, si può procedere con la lettura o la scrittura di file Excel in Python. Ogni libreria ha le sue caratteristiche e sintassi uniche, quindi è essenziale scegliere quella che meglio si adatta alle tue esigenze.

2 modi per aprire un file Excel in Python

In questa sezione, discuteremo di due metodi popolari per aprire un foglio di calcolo Excel. Esploreremo come farlo con entrambe le librerie Pandas e Openpyxl.

1.Utilizzo dei panda

Pandas è una potente libreria di analisi dei dati in Python che fornisce comode funzionalità per leggere, scrivere e manipolare i dati da vari formati, inclusi i formati di file Excel e CSV.

Puoi verificarne le capacità in questo video su Come ricampionare i dati delle serie temporali utilizzando Panda per migliorare l'analisi:

Per aprire un foglio di calcolo Excel utilizzando Pandas, seguire le istruzioni seguenti:

  1. Innanzitutto, installa la libreria Pandas se non l'hai già fatto. Puoi installarlo usando pip:

    pip install pandas
    Come aprire un file Excel in Python: passo dopo passo
  2. Successivamente, importa Pandas nel tuo script Python e usa la funzione read_excel() per caricare il file:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Questo leggerà il foglio Excel specificato in un DataFrame Pandas, che può quindi essere facilmente manipolato utilizzando varie funzioni integrate.

Nota: se non si specifica il nome di un foglio, la libreria Pandas importerà tutti i fogli e li memorizzerà in un dizionario. È possibile accedere a questi fogli utilizzando il nome del foglio come chiave.

Ad esempio, se desideri recuperare un foglio denominato " report_mensili ", puoi utilizzare il codice seguente:

print(df['monthly_report'])

2.Utilizzando openpyxl

Openpyxl è un'altra popolare libreria in Python per lavorare in modo specifico con i file Excel. Per aprire una cartella di lavoro di Excel in Python utilizzando Openpyxl, seguire le istruzioni seguenti:

  1. Innanzitutto, installa openpyxl se non l'hai già fatto. Puoi installarlo usando pip:

    pip install openpyxl
  2. Successivamente, importa openpyxl nel tuo IDE Python e usa la funzione load_workbook() per caricare la cartella di lavoro di Excel:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Questo caricherà il file Excel specificato e fornirà l'accesso ai suoi fogli, righe e singole celle, consentendoti di lavorare facilmente con i suoi dati.

Sia Pandas che openpyxl sono potenti librerie che ti consentono di aprire e manipolare in modo efficiente i file Excel in Python. Scegli quello che meglio si adatta alle tue esigenze e requisiti specifici.

Come leggere i dati di Excel in Python?

La lettura dei dati di Excel in Python può essere facilmente ottenuta utilizzando la libreria Pandas, che fornisce un insieme di metodi potenti e semplici da usare per lavorare con i dati tabulari. In questa sezione imparerai come leggere i dati di Excel utilizzando i panda, concentrandoti sull'accesso a fogli specifici e sul recupero dei valori delle celle.

Leggi Foglio Specifico

Per leggere un foglio specifico da un file Excel utilizzando i panda, è sufficiente passare il nome del foglio o l'indice del foglio come parametro al metodo read_excel. Ecco un esempio:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Questo frammento di codice importa la libreria Pandas e specifica il nome del foglio di calcolo Excel e il foglio da leggere. Quindi legge il foglio specificato utilizzando il metodo read_excel() e stampa il DataFrame risultante.

Per importare più fogli nel data frame, è sufficiente impostare il parametro sheet_name in modo che sia uguale a None. Questo importerà tutti i fogli nella cartella di lavoro nel tuo dataframe.

Leggi i valori delle celle

Una volta terminata l'importazione dei dati in un DataFrame panda, è possibile accedere ai valori delle singole celle utilizzando il metodo iat[] di DataFrame. Il metodo accetta come argomenti gli indici di riga e di colonna.

Ecco un esempio:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Questo frammento di codice estrae il valore della cella all'indice di riga 1 e all'indice di colonna 2 (corrispondente alla seconda riga e alla terza colonna) dal DataFrame (df) precedentemente caricato. Dopo aver estratto il valore della cella, stampa il valore.

In questa sezione, hai imparato a leggere i dati di Excel in Python, con particolare attenzione alla lettura di fogli specifici e al recupero dei valori delle celle utilizzando la libreria Pandas. Questa conoscenza ti consentirà di lavorare in modo efficiente con i dati di Excel nei tuoi progetti Python.

Come manipolare i dati di Excel

In questa sezione, discuteremo come aggiornare i valori delle celle e aggiungere o eliminare righe e colonne in un file Excel utilizzando Python. Per questi esempi, utilizzeremo OpenPyXL poiché offre diversi metodi che è possibile utilizzare per modificare o inserire dati in una cartella di lavoro di Excel.

Aggiorna i valori delle celle

Per modificare i valori delle celle di Excel, utilizzeremo la libreria openpyXL. Successivamente, importa il modulo richiesto e carica la cartella di lavoro di Excel:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Seleziona il foglio Excel che desideri manipolare.

sheet = workbook.active

Il metodo attivo seleziona il primo foglio nella cartella di lavoro. Se vuoi selezionare un foglio diverso, usa il formato cartella di lavoro[< nome foglio >] .

Per modificare il valore di una cella, è sufficiente assegnare un nuovo valore alla cella desiderata:

sheet['A1'] = "New Value"

Infine, salva la cartella di lavoro modificata:

workbook.save('example_modified.xlsx')

Aggiungi ed elimina righe e colonne

L'aggiunta e l'eliminazione di righe o colonne può essere eseguita facilmente con OpenPyXL. Ecco come:

Aggiungi righe: per inserire righe, utilizzare la funzione insert_rows() . L'esempio seguente aggiunge due righe dopo la prima riga:

sheet.insert_rows(2, 2)

Elimina righe: per eliminare righe, utilizzare la funzione delete_rows() . L'esempio seguente elimina due righe a partire dalla riga 3:

sheet.delete_rows(3, 2)

Aggiungi colonne: per inserire colonne, utilizzare la funzione insert_cols() . L'esempio seguente aggiunge due colonne dopo la prima colonna:

sheet.insert_cols(2, 2)

Elimina colonne: per eliminare colonne, utilizzare la funzione delete_cols() . L'esempio seguente elimina due colonne a partire dalla colonna 3:

sheet.delete_cols(3, 2)

Ricordati di salvare la cartella di lavoro aggiornata:

workbook.save('example_modified.xlsx')

Come salvare un file Excel in Python

Per salvare un file Excel in Python, puoi utilizzare librerie come Pandas o openpyxl. Entrambe le librerie offrono metodi diversi per la scrittura dei dati nei file Excel. In questa sezione, esploreremo ogni approccio e forniremo esempi su come salvare un file Excel utilizzando Python.

Utilizzo di Panda: Panda è una popolare libreria per la manipolazione e l'analisi dei dati. Ha un metodo integrato chiamato to_excel() che consente di salvare un DataFrame come file Excel:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

In questo esempio, creiamo un DataFrame di esempio e lo salviamo come file Excel denominato "output.xlsx" utilizzando il metodo to_excel() . Puoi vedere il foglio di calcolo risultante di seguito.

Come aprire un file Excel in Python: passo dopo passo

Utilizzo di OpenPyXL: openpyxl è un'altra potente libreria appositamente progettata per lavorare con i file di Microsoft Excel. Ecco un esempio di come salvare i dati in un file Excel utilizzando OpenPyXL:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

In questo esempio, creiamo una nuova cartella di lavoro e aggiungiamo dati al foglio di lavoro attivo usando il metodo append() . Infine, salviamo la cartella di lavoro come file Excel denominato " output_openpyxl.xlsx ".

Come aprire un file Excel in Python: passo dopo passo

Sia Pandas che openpyxl forniscono funzionalità affidabili per il salvataggio di file Excel in Python. Quindi, la tua scelta dipende dai requisiti e dalla complessità dei tuoi compiti.

È ora di concludere le cose

In questo articolo, abbiamo esplorato diverse librerie per aprire e lavorare con i file Excel in Python. Ognuna di queste librerie ha le sue caratteristiche e vantaggi unici, che ti consentono di eseguire attività come leggere e scrivere dati, accedere a fogli e manipolare i valori delle celle.

Incorporando i metodi discussi in questo articolo, puoi lavorare in modo efficiente con i file Excel, espandere le capacità dei tuoi progetti e migliorare le tue capacità di analisi e manipolazione dei dati.

Man mano che continui a utilizzare queste librerie ed esplori le loro funzionalità, diventerai più abile nella gestione dei fogli di calcolo con Python. Questo articolo ti ha ora dotato delle competenze necessarie per portare a termine il lavoro. È ora di mettere alla prova le tue nuove abilità!


Power Automate si applica a ogni azione nei flussi di lavoro

Power Automate si applica a ogni azione nei flussi di lavoro

Scopri l

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.

Filtro Power Apps: cosè e come si usa?

Filtro Power Apps: cosè e come si usa?

Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Connettori Power Automate: numero, testo e data e ora

Connettori Power Automate: numero, testo e data e ora

Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Ora, è molto facile studiare il budget rispetto all

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.

Che cosè Power Query e M Language: una panoramica dettagliata

Che cosè Power Query e M Language: una panoramica dettagliata

Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.

Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.