Jak otworzyć plik Excela w Pythonie: krok po kroku

Praca z plikami Excela jest częstym zadaniem w codziennym życiu wielu profesjonalistów, niektórzy z nas to uwielbiają, a inni nienawidzą. Jednak Python udostępnia kilka bibliotek, które czynią ten proces prostszym, usprawnionym i wydajniejszym.

Zarówno biblioteka Pandas, jak i openpyxl umożliwiają użytkownikom otwieranie pliku Excela w Pythonie. Pandas ma wbudowaną metodę ułatwiającą, podczas gdy openpyxl jest świetny, gdy potrzebujesz większej kontroli nad strukturą i formatowaniem pliku.

W tym artykule przyjrzymy się różnym metodom otwierania i pracy z arkuszami kalkulacyjnymi w Pythonie przy użyciu tych bibliotek. Dzięki tej wiedzy będziesz w stanie wydajnie przetwarzać i analizować dane Excela przy użyciu potężnych narzędzi zapewnianych przez rozbudowany ekosystem Pythona!

Jak otworzyć plik Excela w Pythonie: krok po kroku

Spis treści

Jakie są wymagania wstępne?

Zanim zagłębisz się w proces otwierania pliku Excel w Pythonie, musisz spełnić kilka warunków wstępnych. Przede wszystkim powinieneś mieć podstawową wiedzę na temat programowania w języku Python, w tym zmiennych, funkcji i importowania bibliotek.

Ułatwi to zrozumienie i pracę z przykładami kodu podanymi w artykule.

Oprócz podstawowej znajomości języka Python, ważna jest również instalacja niezbędnych bibliotek. Dostępnych jest kilka bibliotek Pythona do pracy z plikami programu Excel, w tym:

  • pandas: potężna biblioteka do manipulacji danymi.

  • openpyxl: Popularna biblioteka do czytania i pisania plików Excela.

  • xlrd: Biblioteka do odczytu danych i formatowania informacji z plików Excela.

  • xlwt: Biblioteka do zapisywania danych i formatowania informacji w plikach Excela.

  • xlutils: Zestaw narzędzi do pracy ze skoroszytami programu Excel, w tym do czytania, pisania i modyfikowania danych.

Aby zainstalować dowolną z powyższych bibliotek za pomocą pip, otwórz wiersz polecenia lub terminal i wpisz następujące polecenie, zastępując ` nazwa_biblioteki` żądaną biblioteką:

pip install 

Kolejnym kluczowym warunkiem wstępnym jest posiadanie arkusza kalkulacyjnego Excel do pracy. Powinieneś przygotować skoroszyt programu Excel zawierający dane, którymi chcesz manipulować w Pythonie.

Możesz pobrać przykładowe skoroszyty z witryny firmy Microsoft i innych samouczków.

Chociaż plik może mieć wiele arkuszy i różne formatowanie, zaleca się rozpoczęcie od prostego zestawu danych na potrzeby wstępnego procesu uczenia się. Możesz poradzić sobie ze złożonymi arkuszami kalkulacyjnymi, gdy zdobędziesz więcej doświadczenia i zrozumiesz używane biblioteki.

Jak otworzyć plik Excela w Pythonie: krok po kroku

Jak zainstalować wymagane biblioteki

Aby pracować z arkuszami kalkulacyjnymi Excel w Pythonie, musisz zainstalować odpowiednie biblioteki. Dostępnych jest kilka bibliotek do tego celu, ale dwie najpopularniejsze to openPyXL i xlrd .

OpenPyXL to biblioteka Pythona, która umożliwia odczytywanie i zapisywanie plików Excela (w szczególności plików xltm, xlsm, xltx i xlsx). Nie wymaga instalacji programu Microsoft Excel i działa na wszystkich platformach. Aby zainstalować OpenPyXL za pomocą pip, uruchom następujące polecenie w swoim terminalu:

pip install openpyxl

Z drugiej strony xlrd to kolejna powszechnie używana biblioteka do odczytu danych i formatowania informacji z plików Excela. W szczególności obsługuje formaty plików xls i xlsx.

Aby zainstalować xlrd za pomocą pip, uruchom następujące polecenie w swoim terminalu:

pip install xlrd

Po zainstalowaniu żądanej biblioteki można przystąpić do czytania lub pisania plików Excela w Pythonie. Każda biblioteka ma swoje unikalne cechy i składnię, dlatego ważne jest, aby wybrać tę, która najlepiej odpowiada Twoim wymaganiom.

2 sposoby otwierania pliku Excel w Pythonie

W tej sekcji omówimy dwie popularne metody otwierania arkusza kalkulacyjnego Excel. Będziemy badać, jak możesz to zrobić z bibliotekami Pandas i Openpyxl.

1. Używanie Pand

Pandas to potężna biblioteka do analizy danych w języku Python, która zapewnia wygodne funkcje do odczytu, zapisu i manipulowania danymi z różnych formatów, w tym formatów plików Excel i CSV.

Możesz sprawdzić jego możliwości w tym filmie na temat ponownego próbkowania danych szeregów czasowych za pomocą pand w celu ulepszenia analizy:

Aby otworzyć arkusz kalkulacyjny programu Excel za pomocą Pand, postępuj zgodnie z poniższymi instrukcjami:

  1. Najpierw zainstaluj bibliotekę Pandas, jeśli jeszcze tego nie zrobiłeś. Możesz go zainstalować za pomocą pip:

    pip install pandas
    Jak otworzyć plik Excela w Pythonie: krok po kroku
  2. Następnie zaimportuj Pandas do skryptu Pythona i użyj funkcji read_excel(), aby załadować plik:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Spowoduje to wczytanie określonego arkusza Excela do Pandas DataFrame, którym można następnie łatwo manipulować za pomocą różnych wbudowanych funkcji.

Uwaga: Jeśli nie określisz nazwy arkusza, biblioteka pandas zaimportuje wszystkie arkusze i zapisze je w słowniku. Dostęp do tych arkuszy można uzyskać, używając nazwy arkusza jako klucza.

Na przykład, jeśli chcesz pobrać arkusz o nazwie „ Month_report ”, możesz użyć poniższego kodu:

print(df['monthly_report'])

2. Używanie openpyxl

Openpyxl to kolejna popularna biblioteka w Pythonie do pracy z plikami Excela. Aby otworzyć skoroszyt programu Excel w Pythonie przy użyciu Openpyxl, postępuj zgodnie z poniższymi instrukcjami:

  1. Najpierw zainstaluj openpyxl, jeśli jeszcze tego nie zrobiłeś. Możesz go zainstalować za pomocą pip:

    pip install openpyxl
  2. Następnie zaimportuj plik openpyxl do środowiska IDE Pythona i użyj funkcji load_workbook() , aby załadować skoroszyt programu Excel:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Spowoduje to załadowanie określonego pliku programu Excel i zapewnienie dostępu do jego arkuszy, wierszy i poszczególnych komórek, umożliwiając łatwą pracę z jego danymi.

Zarówno Pandas, jak i openpyxl to potężne biblioteki, które pozwalają wydajnie otwierać i manipulować plikami Excela w Pythonie. Wybierz ten, który najlepiej odpowiada Twoim konkretnym potrzebom i wymaganiom.

Jak czytać dane Excela w Pythonie?

Odczytywanie danych programu Excel w Pythonie można łatwo osiągnąć za pomocą biblioteki Pandas, która zapewnia potężny i prosty w użyciu zestaw metod do pracy z danymi tabelarycznymi. W tej sekcji dowiesz się, jak odczytywać dane Excela za pomocą pand, koncentrując się na dostępie do określonych arkuszy i pobieraniu wartości komórek.

Przeczytaj konkretny arkusz

Aby odczytać określony arkusz z pliku programu Excel za pomocą pand, wystarczy przekazać nazwę arkusza lub indeks arkusza jako parametr do metody read_excel. Oto przykład:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

This code snippet imports the Pandas library and specifies the name of the Excel spreadsheet, and the sheet to be read. It then reads the specified sheet using the read_excel() method and prints the resulting DataFrame.

To import multiple sheets into the data frame, just set the sheet_name parameter to be equal to None. This will import all the sheets in the workbook into your dataframe.

Read Cell Values

Once you’re done importing data into a pandas DataFrame, you can access individual cell values using the DataFrame’s iat[] method. The method takes row and column indices as its arguments.

Here’s an example:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

This code snippet extracts the cell value at row index 1 and column index 2 (corresponding to the second row and third column) from the previously loaded DataFrame (df). After extracting the cell value, it prints the value.

In this section, you have learned how to read Excel data in Python, with a focus on reading specific sheets and retrieving cell values using the pandas library. This knowledge will enable you to efficiently work with Excel data in your Python projects.

How to Manipulate Excel Data

In this section, we will discuss how to update cell values, and add or delete rows and columns in an Excel file using Python. For these examples, we’ll be using OpenPyXL since it offers several methods you can use to change or insert data in an Excel workbook.

Update Cell Values

Aby zmodyfikować wartości komórek programu Excel, użyjemy biblioteki openpyXL. Następnie zaimportuj wymagany moduł i załaduj skoroszyt programu Excel:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Wybierz arkusz programu Excel, którym chcesz manipulować.

sheet = workbook.active

Metoda aktywna wybiera pierwszy arkusz w skoroszycie. Jeśli chcesz wybrać inny arkusz, użyj formatu skoroszyt[< nazwa arkusza >] .

Aby zmienić wartość komórki, po prostu przypisz nową wartość do żądanej komórki:

sheet['A1'] = "New Value"

Na koniec zapisz zmodyfikowany skoroszyt:

workbook.save('example_modified.xlsx')

Dodawaj i usuwaj wiersze i kolumny

Dodawanie i usuwanie wierszy lub kolumn można łatwo wykonać za pomocą OpenPyXL. Oto jak:

Dodaj wiersze: Aby wstawić wiersze, użyj funkcji insert_rows() . Poniższy przykład dodaje dwa wiersze po pierwszym wierszu:

sheet.insert_rows(2, 2)

Usuń wiersze: Aby usunąć wiersze, użyj funkcji delete_rows() . Poniższy przykład usuwa dwa wiersze, zaczynając od wiersza 3:

sheet.delete_rows(3, 2)

Dodaj kolumny: Aby wstawić kolumny, użyj funkcji insert_cols() . Poniższy przykład dodaje dwie kolumny po pierwszej kolumnie:

sheet.insert_cols(2, 2)

Usuń kolumny: Aby usunąć kolumny, użyj funkcji delete_cols() . Poniższy przykład usuwa dwie kolumny, zaczynając od kolumny 3:

sheet.delete_cols(3, 2)

Pamiętaj, aby zapisać zaktualizowany skoroszyt:

workbook.save('example_modified.xlsx')

Jak zapisać plik Excela w Pythonie

Aby zapisać plik Excela w Pythonie, możesz skorzystać z bibliotek takich jak Pandas lub openpyxl. Obie biblioteki oferują różne metody zapisu danych do plików Excel. W tej sekcji omówimy każde podejście i przedstawimy przykłady zapisywania pliku programu Excel przy użyciu języka Python.

Korzystanie z Pandas: Pandas to popularna biblioteka do manipulacji i analizy danych. Ma wbudowaną metodę o nazwie to_excel() , która pozwala zapisać DataFrame jako plik Excel:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

W tym przykładzie tworzymy przykładową ramkę DataFrame i zapisujemy ją jako plik programu Excel o nazwie „output.xlsx” przy użyciu metody to_excel() . Wynikowy arkusz kalkulacyjny można zobaczyć poniżej.

Jak otworzyć plik Excela w Pythonie: krok po kroku

Korzystanie z OpenPyXL: openpyxl to kolejna potężna biblioteka zaprojektowana specjalnie do pracy z plikami Microsoft Excel. Oto przykład, jak zapisać dane do pliku Excel przy użyciu OpenPyXL:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

W tym przykładzie tworzymy nowy skoroszyt i dodajemy dane do aktywnego arkusza za pomocą metody append() . Na koniec zapisujemy skoroszyt jako plik programu Excel o nazwie „ output_openpyxl.xlsx ”.

Jak otworzyć plik Excela w Pythonie: krok po kroku

Zarówno Pandas, jak i openpyxl zapewniają solidną funkcjonalność zapisywania plików Excela w Pythonie. Twój wybór zależy więc od wymagań i złożoności zadań.

Czas na podsumowanie

W tym artykule zbadaliśmy różne biblioteki do otwierania i pracy z plikami Excela w Pythonie. Każda z tych bibliotek ma swoje unikalne cechy i zalety, umożliwiając wykonywanie zadań, takich jak odczytywanie i zapisywanie danych, uzyskiwanie dostępu do arkuszy i manipulowanie wartościami komórek.

Stosując metody omówione w tym artykule, możesz wydajnie pracować z plikami Excel, rozszerzyć możliwości swoich projektów oraz poprawić swoje umiejętności analizy danych i manipulowania nimi.

Kontynuując korzystanie z tych bibliotek i poznając ich funkcje, staniesz się bardziej biegły w obsłudze arkuszy kalkulacyjnych w Pythonie. Ten artykuł wyposażył Cię w umiejętności potrzebne do wykonania pracy. Czas przetestować nowe umiejętności!

Leave a Comment

Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr

Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr

W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.

Funkcje zbierania w Microsoft Power Automate

Funkcje zbierania w Microsoft Power Automate

Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.

Oceń wydajność kodu DAX w DAX Studio

Oceń wydajność kodu DAX w DAX Studio

Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.

Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Jak zapisać i załadować plik RDS w R

Jak zapisać i załadować plik RDS w R

Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.