Ce este Sinele în Python: Exemple din lumea reală
Ce este Sinele în Python: Exemple din lumea reală
Lucrul cu fișiere Excel este o sarcină comună în viața de zi cu zi a multor profesioniști, unii dintre noi îl iubesc, iar alții îl urăsc. Cu toate acestea, Python oferă mai multe biblioteci pentru a face acest proces mai ușor, mai eficient și mai eficient.
Atât Biblioteca Pandas, cât și openpyxl permit utilizatorilor să deschidă un fișier Excel în Python. Pandas are o metodă încorporată care face acest lucru ușor, în timp ce openpyxl este grozav atunci când aveți nevoie de mai mult control asupra structurii și formatării fișierului.
În acest articol, vom explora diferite metode de a deschide și de a lucra cu foi de calcul în Python folosind aceste biblioteci. Cu aceste cunoștințe, veți putea procesa și analiza eficient datele Excel folosind instrumentele puternice oferite de ecosistemul extins al Python!
Cuprins
Care sunt premisele?
Înainte de a aborda procesul de deschidere a unui fișier Excel în Python, există câteva condiții preliminare care trebuie să fie îndeplinite. În primul rând, ar trebui să aveți o înțelegere de bază a programării Python, inclusiv variabile, funcții și biblioteci de import.
Acest lucru vă va ajuta să înțelegeți și să lucrați cu ușurință cu exemplele de cod furnizate în articol.
Pe lângă cunoștințele de bază Python, este importantă și instalarea bibliotecilor necesare. Există mai multe biblioteci Python disponibile pentru a lucra cu fișiere Excel, inclusiv:
panda: O bibliotecă puternică de manipulare a datelor.
openpyxl: O bibliotecă populară pentru citirea și scrierea fișierelor Excel.
xlrd: O bibliotecă pentru citirea datelor și formatarea informațiilor din fișierele Excel.
xlwt: O bibliotecă pentru scrierea datelor și formatarea informațiilor în fișiere Excel.
xlutils: o suită de instrumente pentru lucrul cu registrele de lucru Excel, inclusiv citirea, scrierea și modificarea datelor.
Pentru a instala oricare dintre bibliotecile de mai sus folosind pip, deschideți promptul de comandă sau terminalul și tastați următoarea comandă, înlocuind ` library_name` cu biblioteca dorită:
pip install
O altă condiție esențială este să aveți o foaie de calcul Excel cu care să lucrați. Ar trebui să pregătiți un registru de lucru Excel care să conțină datele pe care doriți să le manipulați cu Python.
Puteți descărca exemple de registre de lucru de pe Microsoft și alte site-uri de tutoriale.
Deși fișierul poate avea mai multe foi și diverse formatări, este recomandabil să începeți cu un set de date simplu pentru procesul inițial de învățare. Puteți aborda foile de calcul complexe odată ce obțineți mai multă experiență și înțelegere a bibliotecilor utilizate.
Cum se instalează bibliotecile necesare
Pentru a lucra cu foi de calcul Excel în Python, trebuie să instalați bibliotecile corespunzătoare. Există mai multe biblioteci disponibile în acest scop, dar două dintre cele mai populare sunt openPyXL și xlrd .
OpenPyXL este o bibliotecă Python care permite citirea și scrierea fișierelor Excel (în special fișiere xltm, xlsm, xltx și xlsx). Nu necesită instalarea Microsoft Excel și funcționează pe toate platformele. Pentru a instala OpenPyXL folosind pip, rulați următoarea comandă în terminal:
pip install openpyxl
Pe de altă parte, xlrd este o altă bibliotecă utilizată pe scară largă pentru citirea datelor și formatarea informațiilor din fișierele Excel. Acceptă în mod special formatele de fișiere xls și xlsx.
Pentru a instala xlrd folosind pip, rulați următoarea comandă în terminalul dvs.:
pip install xlrd
Odată ce biblioteca dorită este instalată, se poate continua cu citirea sau scrierea fișierelor Excel în Python. Fiecare bibliotecă are caracteristicile și sintaxa ei unice, așa că este esențial să o alegeți pe cea care se potrivește cel mai bine cerințelor dumneavoastră.
2 moduri de a deschide un fișier Excel în Python
În această secțiune, vom discuta două metode populare de a deschide o foaie de calcul Excel. Vom explora cum puteți face acest lucru atât cu bibliotecile Pandas, cât și cu Openpyxl.
1. Folosind Pandas
Pandas este o bibliotecă puternică de analiză a datelor în Python, care oferă funcționalități convenabile pentru a citi, scrie și manipula date din diferite formate, inclusiv formate de fișiere Excel și CSV.
Puteți verifica capabilitățile sale în acest videoclip despre Cum să reeșantionați datele din seria temporală folosind Pandas pentru a îmbunătăți analiza:
Pentru a deschide o foaie de calcul Excel folosind Pandas, urmați instrucțiunile de mai jos:
Mai întâi, instalați biblioteca Pandas dacă nu ați făcut-o deja. Îl puteți instala folosind pip:
pip install pandas
Apoi, importați Pandas în scriptul dvs. Python și utilizați funcția read_excel() pentru a încărca fișierul:
#Read excel spreadsheets with pandas
import pandas as pd
file_name = "path/to/your/file.xlsx" # Replace with your file path
sheet = "Sheet1" # Specify the sheet name or number
df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df.head(5)) # Print first 5 rows of the dataframe
Aceasta va citi foaia Excel specificată într-un Pandas DataFrame, care poate fi apoi manipulat cu ușurință folosind diverse funcții încorporate.
Notă: Dacă nu specificați un nume de foaie, biblioteca panda va importa toate foile și le va stoca într-un dicționar. Puteți accesa aceste foi folosind numele foii ca o cheie.
De exemplu, dacă doriți să preluați o foaie numită „ raport_lunar ”, puteți utiliza codul de mai jos:
print(df['monthly_report'])
2. Folosind openpyxl
Openpyxl este o altă bibliotecă populară în Python pentru lucrul specific cu fișiere Excel. Pentru a deschide un registru de lucru Excel în Python utilizând Openpyxl, urmați instrucțiunile de mai jos:
Mai întâi, instalați openpyxl dacă nu ați făcut-o deja. Îl puteți instala folosind pip:
pip install openpyxl
Apoi, importați openpyxl în IDE-ul dvs. Python și utilizați funcția load_workbook() pentru a încărca registrul de lucru Excel:
from openpyxl import load_workbook file_name = "path/to/your/file.xlsx" # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows(): print([cell.value for cell in row])
Aceasta va încărca fișierul Excel specificat și va oferi acces la foile, rândurile și celulele individuale ale acestuia, permițându-vă să lucrați cu ușurință cu datele acestuia.
Atât Pandas, cât și openpyxl sunt biblioteci puternice care vă permit să deschideți și să manipulați eficient fișierele Excel în Python. Alegeți-l pe cel care se potrivește cel mai bine nevoilor și cerințelor dumneavoastră specifice.
Cum să citești datele Excel în Python?
Citirea datelor Excel în Python poate fi realizată cu ușurință folosind biblioteca Pandas, care oferă un set puternic și simplu de utilizat de metode de lucru cu date tabulare. În această secțiune, veți învăța cum să citiți datele Excel folosind panda, concentrându-vă pe accesarea anumitor foi și pe recuperarea valorilor celulelor.
Citiți Fișa Specifică
Pentru a citi o anumită foaie dintr-un fișier Excel folosind panda, trebuie pur și simplu să treceți numele foii sau indexul foii ca parametru la read_excelmethod. Iată un exemplu:
import pandas as pd
file_name = 'example.xlsx'
sheet = 'Sheet1'
df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)
Acest fragment de cod importă biblioteca Pandas și specifică numele foii de calcul Excel și foaia de citit. Apoi citește foaia specificată folosind metoda read_excel() și tipărește DataFrame-ul rezultat.
Pentru a importa mai multe foi în cadrul de date, trebuie doar să setați parametrul sheet_name să fie egal cu None. Acest lucru va importa toate foile din registrul de lucru în cadrul dvs. de date.
Citiți valorile celulei
După ce ați terminat de importat date într-un Pandas DataFrame, puteți accesa valorile individuale ale celulei folosind metoda iat[] a DataFrame . Metoda ia ca argument indici de rânduri și coloane.
Iată un exemplu:
cell_value = df.iat[1, 2]
print(f'The cell value at row 2, column 3 is: {cell_value}')
Acest fragment de cod extrage valoarea celulei de la indexul rândului 1 și indexul coloanei 2 (corespunzător celui de-al doilea rând și al treilea rând) din DataFrame (df) încărcat anterior. După extragerea valorii celulei, se tipărește valoarea.
În această secțiune, ați învățat cum să citiți datele Excel în Python, cu accent pe citirea unor foi specifice și recuperarea valorilor celulelor folosind biblioteca Pandas. Aceste cunoștințe vă vor permite să lucrați eficient cu datele Excel în proiectele dvs. Python.
Cum se manipulează datele Excel
În această secțiune, vom discuta despre cum să actualizați valorile celulelor și să adăugați sau să ștergeți rânduri și coloane într-un fișier Excel folosind Python. Pentru aceste exemple, vom folosi OpenPyXL, deoarece oferă mai multe metode pe care le puteți utiliza pentru a modifica sau a insera date într-un registru de lucru Excel.
Actualizați valorile celulelor
Pentru a modifica valorile celulelor Excel, vom folosi biblioteca openpyXL. Apoi, importați modulul necesar și încărcați registrul de lucru Excel:
#Reading excel files with openpyxl
from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')
Selectați foaia Excel pe care doriți să o manipulați.
sheet = workbook.active
Metoda activă selectează prima foaie din registrul de lucru. Dacă doriți să selectați o altă foaie, utilizați formatul registru de lucru[< numele foii >] .
Pentru a modifica valoarea unei celule, pur și simplu atribuiți o nouă valoare celulei dorite:
sheet['A1'] = "New Value"
În cele din urmă, salvați registrul de lucru modificat:
workbook.save('example_modified.xlsx')
Adăugați și ștergeți rânduri și coloane
Adăugarea și ștergerea de rânduri sau coloane se poate face cu ușurință cu OpenPyXL. Iată cum:
Adăugați rânduri: pentru a insera rânduri, utilizați funcția insert_rows() . Următorul exemplu adaugă două rânduri după primul rând:
sheet.insert_rows(2, 2)
Delete Rows: Pentru a șterge rânduri, utilizați funcția delete_rows() . Următorul exemplu șterge două rânduri începând de la rândul 3:
sheet.delete_rows(3, 2)
Adăugați coloane: pentru a insera coloane, utilizați funcția insert_cols() . Următorul exemplu adaugă două coloane după prima coloană:
sheet.insert_cols(2, 2)
Ștergeți coloane: Pentru a șterge coloanele, utilizați funcția delete_cols() . Următorul exemplu șterge două coloane începând cu coloana 3:
sheet.delete_cols(3, 2)
Nu uitați să salvați registrul de lucru actualizat:
workbook.save('example_modified.xlsx')
Cum să salvați un fișier Excel în Python
Pentru a salva un fișier Excel în Python, puteți utiliza biblioteci precum Pandas sau openpyxl. Ambele biblioteci oferă metode diferite de scriere a datelor în fișiere Excel. În această secțiune, vom explora fiecare abordare și vom oferi exemple despre cum să salvați un fișier Excel folosind Python.
Utilizarea Pandas: Pandas este o bibliotecă populară pentru manipularea și analiza datelor. Are o metodă încorporată numită to_excel() care vă permite să salvați un DataFrame ca fișier Excel:
import pandas as pd
# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)
# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)
În acest exemplu, creăm un exemplu de DataFrame și îl salvăm ca fișier Excel numit „output.xlsx” folosind metoda to_excel() . Puteți vedea foaia de calcul rezultată mai jos.
Utilizarea OpenPyXL: openpyxl este o altă bibliotecă puternică special concepută pentru lucrul cu fișiere Microsoft Excel. Iată un exemplu despre cum să salvați date într-un fișier Excel folosind OpenPyXL:
from openpyxl import Workbook
# Creating a new workbook
wb = Workbook()
# Selecting the active worksheet
ws = wb.active
# Adding data to the worksheet
data = [
(1, 'A'),
(2, 'B'),
(3, 'C'),
(25, 'Y'),
(26, 'Z')
]
for row in data:
ws.append(row)
# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')
În acest exemplu, creăm un nou registru de lucru și adăugăm date la foaia de lucru activă folosind metoda append() . În cele din urmă, salvăm registrul de lucru ca fișier Excel numit „ output_openpyxl.xlsx ”.
Atât Pandas, cât și openpyxl oferă o funcționalitate robustă pentru salvarea fișierelor Excel în Python. Deci, alegerea ta depinde de cerințele și de complexitatea sarcinilor tale.
E timpul să închei lucrurile
În acest articol, am explorat diferite biblioteci pentru deschiderea și lucrul cu fișiere Excel în Python. Fiecare dintre aceste biblioteci are propriile caracteristici și avantaje unice, permițându-vă să efectuați sarcini precum citirea și scrierea datelor, accesarea foilor și manipularea valorilor celulelor.
Încorporând metodele discutate în acest articol, puteți lucra eficient cu fișiere Excel, puteți extinde capacitățile proiectelor dvs. și puteți îmbunătăți abilitățile de analiză și manipulare a datelor.
Pe măsură ce continuați să utilizați aceste biblioteci și să explorați funcționalitățile lor, veți deveni mai priceput în gestionarea foilor de calcul cu Python. Acest articol v-a dotat acum cu abilitățile de care aveți nevoie pentru a finaliza treaba. Este timpul să-ți testezi noile abilități!
Ce este Sinele în Python: Exemple din lumea reală
Veți învăța cum să salvați și să încărcați obiecte dintr-un fișier .rds în R. Acest blog va trata, de asemenea, cum să importați obiecte din R în LuckyTemplates.
În acest tutorial despre limbajul de codare DAX, aflați cum să utilizați funcția GENERATE și cum să schimbați în mod dinamic titlul unei măsuri.
Acest tutorial va acoperi cum să utilizați tehnica Multi Threaded Dynamic Visuals pentru a crea informații din vizualizările dinamice de date din rapoartele dvs.
În acest articol, voi trece prin contextul filtrului. Contextul de filtrare este unul dintre subiectele majore despre care orice utilizator LuckyTemplates ar trebui să învețe inițial.
Vreau să arăt cum serviciul online LuckyTemplates Apps poate ajuta la gestionarea diferitelor rapoarte și informații generate din diverse surse.
Aflați cum să vă calculați modificările marjei de profit folosind tehnici precum măsurarea ramificării și combinarea formulelor DAX în LuckyTemplates.
Acest tutorial va discuta despre ideile de materializare a cache-urilor de date și despre modul în care acestea afectează performanța DAX-ului în furnizarea de rezultate.
Dacă încă utilizați Excel până acum, atunci acesta este cel mai bun moment pentru a începe să utilizați LuckyTemplates pentru nevoile dvs. de raportare a afacerii.
Ce este LuckyTemplates Gateway? Tot ce trebuie să știți