如何在 Python 中打開 Excel 文件:循序漸進

如何在 Python 中打開 Excel 文件:循序漸進

使用 Excel 文件是許多專業人士日常生活中的一項常見任務,我們中的一些人喜歡它,而另一些人則討厭它。但是,Python 提供了幾個庫來使這個過程更容易、更精簡和更高效。

Pandas 庫和 openpyxl 都允許用戶在 Python 中打開 excel 文件。Pandas 有一個內置的方法使它變得簡單,而當您需要更多地控製文件的結構和格式時,openpyxl 非常有用。

在本文中,我們將探索使用這些庫在 Python 中打開和處理電子表格的各種方法。有了這些知識,您將能夠使用 Python 廣泛的生態系統提供的強大工具高效地處理和分析 Excel 數據!

如何在 Python 中打開 Excel 文件:循序漸進

目錄

什麼是先決條件?

在深入研究用 Python 打開 Excel 文件的過程之前,需要滿足一些先決條件。首先,您應該對 Python 編程有基本的了解,包括變量、函數和導入庫。

這將幫助您輕鬆理解和使用本文中提供的代碼示例。

除了基本的 Python 知識外,安裝必要的庫也很重要。有幾個 Python 庫可用於處理 Excel 文件,包括:

  • pandas: 一個強大的數據操作庫。

  • openpyxl:一個流行的用於讀寫 Excel 文件的庫。

  • xlrd:一個用於從 Excel 文件中讀取數據和格式化信息的庫。

  • xlwt: 用於將數據和格式化信息寫入 Excel 文件的庫。

  • xlutils:一套用於處理 Excel 工作簿的工具,包括讀取、寫入和修改數據。

要使用 pip 安裝上述任何庫,請打開命令提示符或終端並鍵入以下命令,將 ` library_name`替換為所需的庫:

pip install 

另一個重要的先決條件是要使用Excel電子表格。您應該準備一個 Excel 工作簿,其中包含您希望使用 Python 操作的數據。

您可以從 Microsoft 和其他教程站點下載示例工作簿。

雖然文件可以有多個工作表和各種格式,但建議從一個簡單的數據集開始進行初始學習過程。一旦您獲得更多經驗並了解所使用的庫,您就可以處理複雜的電子表格。

如何在 Python 中打開 Excel 文件:循序漸進

如何安裝所需的庫

要在 Python 中使用 Excel 電子表格,您需要安裝適當的庫。有幾個庫可用於此目的,但最流行的兩個是openPyXLxlrd

OpenPyXL 是一個 Python 庫,允許讀取和寫入 Excel 文件(特別是 xltm、xlsm、xltx 和 xlsx 文件)。它不需要安裝 Microsoft Excel 並且可以在所有平台上運行。要使用 pip 安裝 OpenPyXL,請在終端中運行以下命令:

pip install openpyxl

另一方面,xlrd 是另一個廣泛使用的庫,用於從 Excel 文件中讀取數據和格式化信息。它特別支持 xls 和 xlsx 文件格式。

要使用 pip 安裝 xlrd,請在終端中運行以下命令:

pip install xlrd

一旦安裝了所需的庫,就可以繼續用 Python 讀取或寫入 Excel 文件。每個庫都有其獨特的功能和語法,因此必須選擇最適合您要求的庫。

在 Python 中打開 Excel 文件的 2 種方法

在本節中,我們將討論打開 Excel 電子表格的兩種流行方法。我們將探索如何使用 Pandas 和 Openpyxl 庫執行此操作。

1.使用熊貓

Pandas 是 Python 中一個功能強大的數據分析庫,它提供了方便的功能來讀取、寫入和操作各種格式的數據,包括 Excel 和 CSV 文件格式。

您可以在有關如何使用 Pandas 對時間序列數據重新採樣以增強分析的視頻中查看其功能

要使用 Pandas 打開 Excel 電子表格,請按照以下說明操作:

  1. 首先,如果您還沒有安裝 Pandas 庫。你可以使用 pip 安裝它:

    pip install pandas
    如何在 Python 中打開 Excel 文件:循序漸進
  2. 接下來,在 Python 腳本中導入 Pandas 並使用 read_excel() 函數加載文件:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. 這會將指定的 Excel 工作表讀入 Pandas DataFrame,然後可以使用各種內置函數輕鬆操作。

注意:如果您不指定工作表名稱,pandas 庫將導入所有工作表並將它們存儲在字典中。您可以使用工作表名稱作為鍵來訪問這些工作表。

例如,如果要檢索名為“ monthly_report ”的工作表,可以使用以下代碼:

print(df['monthly_report'])

2.使用openpyxl

Openpyxl 是另一個流行的 Python 庫,專門用於處理 Excel 文件。要使用 Openpyxl 在 Python 中打開 Excel 工作簿,請按照以下說明操作:

  1. 首先,如果您還沒有安裝 openpyxl。你可以使用 pip 安裝它:

    pip install openpyxl
  2. 接下來,在您的 Python IDE 中導入 openpyxl 並使用 load_workbook ()函數加載您的 Excel 工作簿:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

這將加載指定的 Excel 文件並提供對其工作表、行和單個單元格的訪問,使您可以輕鬆地處理其數據。

Pandas 和 openpyxl 都是功能強大的庫,可讓您在 Python 中高效地打開和操作 Excel 文件。選擇最適合您的特定需求和要求的一款。

如何在 Python 中讀取 Excel 數據?

使用 Pandas 庫可以輕鬆地在 Python 中讀取 Excel 數據,它提供了一組功能強大且易於使用的方法來處理表格數據。在本節中,您將學習如何使用 pandas 讀取 Excel 數據,重點是訪問特定工作表和檢索單元格值。

閱讀具體表

要使用 pandas 從 Excel 文件中讀取特定工作表,您只需將工作表名稱或工作表索引作為參數傳遞給 read_excelmethod。這是一個例子:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

此代碼片段導入 Pandas 庫並指定 Excel 電子表格的名稱和要讀取的工作表。然後它使用read_excel()方法讀取指定的工作表並打印生成的 DataFrame。

要將多個工作表導入數據框,只需將 sheet_name 參數設置為等於 None。這會將工作簿中的所有工作表導入到您的數據框中。

讀取單元格值

將數據導入 pandas DataFrame 後,您可以使用 DataFrame 的iat[]方法訪問單個單元格值。該方法將行和列索引作為其參數。

這是一個例子:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

此代碼片段從先前加載的 DataFrame (df) 中提取行索引 1 和列索引 2(對應於第二行和第三列)處的單元格值。提取單元格值後,它會打印該值。

在本節中,您學習瞭如何使用 Python 讀取 Excel 數據,重點是使用 pandas 庫讀取特定工作表和檢索單元格值。這些知識將使您能夠在 Python 項目中高效地處理 Excel 數據。

如何操作 Excel 數據

在本節中,我們將討論如何使用 Python 更新單元格值,以及在 Excel 文件中添加或刪除行和列。對於這些示例,我們將使用 OpenPyXL,因為它提供了多種可用於在 Excel 工作簿中更改或插入數據的方法。

更新單元格值

要修改 Excel 單元格值,我們將使用 openpyXL 庫。接下來,導入所需的模塊並加載 Excel 工作簿:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

選擇您要操作的 Excel 工作表。

sheet = workbook.active

活動方法選擇工作簿中的第一個工作表。如果要選擇不同的工作表,請使用工作簿[<工作表名稱>]格式。

要更改單元格值,只需為所需的單元格分配一個新值:

sheet['A1'] = "New Value"

最後,保存修改後的工作簿:

workbook.save('example_modified.xlsx')

添加和刪除行和列

使用 OpenPyXL 可以輕鬆地添加和刪除行或列。就是這樣:

添加行:要插入行,請使用insert_rows()函數。以下示例在第一行之後添加兩行:

sheet.insert_rows(2, 2)

刪除行:要刪除行,請使用delete_rows()函數。以下示例刪除從第 3 行開始的兩行:

sheet.delete_rows(3, 2)

添加列:要插入列,請使用insert_cols()函數。以下示例在第一列之後添加兩列:

sheet.insert_cols(2, 2)

刪除列:要刪除列,請使用delete_cols()函數。以下示例刪除從第 3 列開始的兩列:

sheet.delete_cols(3, 2)

請記住保存更新的工作簿:

workbook.save('example_modified.xlsx')

如何在 Python 中保存 Excel 文件

要用 Python 保存 Excel 文件,您可以使用 Pandas 或 openpyxl 等庫。這兩個庫都提供了將數據寫入 Excel 文件的不同方法。在本節中,我們將探討每種方法,並提供有關如何使用 Python 保存 Excel 文件的示例。

使用 Pandas: Pandas 是一個流行的數據處理和分析庫。它有一個名為to_excel()的內置方法,允許您將 DataFrame 保存為 Excel 文件:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

在此示例中,我們創建了一個示例 DataFrame 並使用to_excel()方法將其保存為名為“output.xlsx”的 Excel 文件。您可以在下面看到生成的電子表格。

如何在 Python 中打開 Excel 文件:循序漸進

使用 OpenPyXL: openpyxl 是另一個功能強大的庫,專為處理 Microsoft Excel 文件而設計。以下是如何使用 OpenPyXL 將數據保存到 Excel 文件的示例:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

在此示例中,我們創建一個新工作簿並使用append()方法將數據添加到活動工作表。最後,我們將工作簿保存為名為“ output_openpyxl.xlsx ”的 Excel 文件。

如何在 Python 中打開 Excel 文件:循序漸進

Pandas 和 openpyxl 都提供了在 Python 中保存 Excel 文件的強大功能。因此,您的選擇取決於任務的要求和復雜性。

是時候結束了

在本文中,我們探索了用於在 Python 中打開和處理 Excel 文件的不同庫。這些庫中的每一個都有其獨特的特性和優勢,允許您執行諸如讀取和寫入數據、訪問工作表和操作單元格值等任務。

通過結合本文中討論的方法,您可以高效地處理 Excel 文件、擴展項目的功能並增強數據分析和操作技能。

隨著您繼續使用這些庫並探索它們的功能,您將更加熟練地使用 Python 處理電子表格。本文現已為您提供了完成工作所需的技能。考驗你新技能的時候到了!


什麼是 Python 中的自我:真實世界的例子

什麼是 Python 中的自我:真實世界的例子

什麼是 Python 中的自我:真實世界的例子

如何在 R 中保存和加載 RDS 文件

如何在 R 中保存和加載 RDS 文件

您將學習如何在 R 中保存和加載 .rds 文件中的對象。本博客還將介紹如何將對像從 R 導入 LuckyTemplates。

回顧前 N 個工作日——DAX 編碼語言解決方案

回顧前 N 個工作日——DAX 編碼語言解決方案

在此 DAX 編碼語言教程中,了解如何使用 GENERATE 函數以及如何動態更改度量標題。

在 LuckyTemplates 中使用多線程動態視覺技術展示見解

在 LuckyTemplates 中使用多線程動態視覺技術展示見解

本教程將介紹如何使用多線程動態可視化技術從報告中的動態數據可視化中創建見解。

LuckyTemplates 篩選上下文簡介

LuckyTemplates 篩選上下文簡介

在本文中,我將貫穿過濾器上下文。篩選上下文是任何 LuckyTemplates 用戶最初應該了解的主要主題之一。

使用 LuckyTemplates 在線服務中的應用程序的最佳技巧

使用 LuckyTemplates 在線服務中的應用程序的最佳技巧

我想展示 LuckyTemplates Apps 在線服務如何幫助管理從各種來源生成的不同報告和見解。

隨著時間的推移分析利潤率變化——使用 LuckyTemplates 和 DAX 進行分析

隨著時間的推移分析利潤率變化——使用 LuckyTemplates 和 DAX 進行分析

了解如何在 LuckyTemplates 中使用度量分支和組合 DAX 公式等技術計算利潤率變化。

DAX Studio 中數據緩存的物化想法

DAX Studio 中數據緩存的物化想法

本教程將討論數據緩存物化的想法,以及它們如何影響 DAX 在提供結果時的性能。

使用 LuckyTemplates 進行業務報告

使用 LuckyTemplates 進行業務報告

如果直到現在你還在使用 Excel,那麼現在是開始使用 LuckyTemplates 來滿足你的業務報告需求的最佳時機。

什麼是 LuckyTemplates 網關?所有你必須知道的

什麼是 LuckyTemplates 網關?所有你必須知道的

什麼是 LuckyTemplates 網關?所有你必須知道的