Como abrir um arquivo do Excel em Python: passo a passo

Trabalhar com arquivos do Excel é uma tarefa comum no dia a dia de muitos profissionais, alguns de nós adoramos, outros detestamos. No entanto, o Python fornece várias bibliotecas para tornar esse processo mais fácil, simplificado e eficiente.

Tanto a Biblioteca Pandas quanto o openpyxl permitem que os usuários abram um arquivo Excel em Python. O Pandas possui um método integrado que facilita, enquanto o openpyxl é ótimo quando você precisa de mais controle sobre a estrutura e a formatação do arquivo.

Neste artigo, exploraremos vários métodos para abrir e trabalhar com planilhas em Python usando essas bibliotecas. Com esse conhecimento, você poderá processar e analisar dados do Excel com eficiência usando as poderosas ferramentas fornecidas pelo extenso ecossistema do Python!

Como abrir um arquivo do Excel em Python: passo a passo

Índice

Quais são os pré-requisitos?

Antes de mergulhar no processo de abrir um arquivo do Excel em Python, existem alguns pré-requisitos que precisam estar em vigor. Em primeiro lugar, você deve ter uma compreensão básica da programação Python, incluindo variáveis, funções e importação de bibliotecas.

Isso ajudará você a entender e trabalhar facilmente com os exemplos de código fornecidos no artigo.

Além do conhecimento básico do Python, também é importante instalar as bibliotecas necessárias. Existem várias bibliotecas Python disponíveis para trabalhar com arquivos do Excel, incluindo:

  • pandas: Uma poderosa biblioteca de manipulação de dados.

  • openpyxl: Uma biblioteca popular para ler e gravar arquivos do Excel.

  • xlrd: Uma biblioteca para ler dados e formatar informações de arquivos do Excel.

  • xlwt: Uma biblioteca para gravar dados e formatar informações em arquivos do Excel.

  • xlutils: um conjunto de ferramentas para trabalhar com pastas de trabalho do Excel, incluindo leitura, gravação e modificação de dados.

Para instalar qualquer uma das bibliotecas acima usando pip, abra o prompt de comando ou terminal e digite o seguinte comando, substituindo ` library_name` pela biblioteca desejada:

pip install 

Outro pré-requisito crucial é ter uma planilha do Excel para trabalhar. Você deve preparar uma pasta de trabalho do Excel contendo os dados que deseja manipular com o Python.

Você pode baixar exemplos de pastas de trabalho da Microsoft e de outros sites de tutoriais.

Embora o arquivo possa ter várias folhas e várias formatações, é aconselhável começar com um conjunto de dados simples para o processo inicial de aprendizado. Você pode lidar com planilhas complexas depois de ganhar mais experiência e compreensão das bibliotecas em uso.

Como abrir um arquivo do Excel em Python: passo a passo

Como instalar as bibliotecas necessárias

Para trabalhar com planilhas do Excel em Python, você precisa instalar as bibliotecas apropriadas. Existem várias bibliotecas disponíveis para esse fim, mas duas das mais populares são openPyXL e xlrd .

OpenPyXL é uma biblioteca Python que permite ler e gravar arquivos do Excel (especificamente arquivos xltm, xlsm, xltx e xlsx). Não requer a instalação do Microsoft Excel e funciona em todas as plataformas. Para instalar o OpenPyXL usando pip, execute o seguinte comando em seu terminal:

pip install openpyxl

Por outro lado, o xlrd é outra biblioteca amplamente utilizada para ler dados e formatar informações de arquivos do Excel. Ele suporta especificamente os formatos de arquivo xls e xlsx.

Para instalar xlrd usando pip, execute o seguinte comando em seu terminal:

pip install xlrd

Uma vez instalada a biblioteca desejada, pode-se prosseguir com a leitura ou gravação de arquivos do Excel em Python. Cada biblioteca tem suas características e sintaxe únicas, por isso é essencial escolher aquela que melhor se adapta às suas necessidades.

2 maneiras de abrir um arquivo do Excel em Python

Nesta seção, discutiremos dois métodos populares para abrir uma planilha do Excel. Estaremos explorando como você pode fazer isso com as bibliotecas Pandas e Openpyxl.

1.Usando Pandas

Pandas é uma poderosa biblioteca de análise de dados em Python que fornece funcionalidades convenientes para ler, gravar e manipular dados de vários formatos, incluindo formatos de arquivo Excel e CSV.

Você pode conferir seus recursos neste vídeo sobre Como reamostrar dados de séries temporais usando Pandas para aprimorar a análise:

Para abrir uma planilha do Excel usando o Pandas, siga as instruções abaixo:

  1. Primeiro, instale a biblioteca Pandas, caso ainda não o tenha feito. Você pode instalá-lo usando pip:

    pip install pandas
    Como abrir um arquivo do Excel em Python: passo a passo
  2. Em seguida, importe Pandas em seu script Python e use a função read_excel() para carregar o arquivo:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Isso lerá a planilha do Excel especificada em um Pandas DataFrame, que pode ser facilmente manipulado usando várias funções internas.

Observação: se você não especificar um nome de planilha, a biblioteca pandas importará todas as planilhas e as armazenará em um dicionário. Você pode acessar essas planilhas usando o nome da planilha como chave.

Por exemplo, se você deseja recuperar uma planilha chamada ' monthly_report ', você pode usar o código abaixo:

print(df['monthly_report'])

2. Usando openpyxl

Openpyxl é outra biblioteca popular em Python para trabalhar especificamente com arquivos do Excel. Para abrir uma pasta de trabalho do Excel em Python usando o Openpyxl, siga as instruções abaixo:

  1. Primeiro, instale o openpyxl, caso ainda não o tenha feito. Você pode instalá-lo usando pip:

    pip install openpyxl
  2. Em seguida, importe openpyxl em seu Python IDE e use a função load_workbook() para carregar sua pasta de trabalho do Excel:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Isso carregará o arquivo Excel especificado e fornecerá acesso a suas planilhas, linhas e células individuais, permitindo que você trabalhe facilmente com seus dados.

Tanto o Pandas quanto o openpyxl são bibliotecas poderosas que permitem abrir e manipular com eficiência arquivos do Excel em Python. Escolha aquele que melhor se adapta às suas necessidades e requisitos específicos.

Como ler dados do Excel em Python?

A leitura de dados do Excel em Python pode ser facilmente obtida usando a biblioteca Pandas, que fornece um conjunto de métodos poderoso e simples de usar para trabalhar com dados tabulares. Nesta seção, você aprenderá a ler dados do Excel usando pandas, com foco no acesso a planilhas específicas e na recuperação de valores de células.

Ler Folha Específica

Para ler uma planilha específica de um arquivo do Excel usando pandas, basta passar o nome da planilha ou o índice da planilha como parâmetro para o método read_excel. Aqui está um exemplo:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Este trecho de código importa a biblioteca Pandas e especifica o nome da planilha do Excel e a planilha a ser lida. Em seguida, ele lê a planilha especificada usando o método read_excel() e imprime o DataFrame resultante.

Para importar várias planilhas para o quadro de dados, basta definir o parâmetro sheet_name para ser igual a Nenhum. Isso importará todas as planilhas da pasta de trabalho para o seu dataframe.

Ler Valores de Células

Assim que terminar de importar dados para um DataFrame pandas, você pode acessar valores de células individuais usando o método iat[] do DataFrame . O método usa índices de linha e coluna como seus argumentos.

Aqui está um exemplo:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Este trecho de código extrai o valor da célula no índice de linha 1 e no índice de coluna 2 (correspondente à segunda linha e à terceira coluna) do DataFrame (df) carregado anteriormente. Depois de extrair o valor da célula, ele imprime o valor.

Nesta seção, você aprendeu a ler dados do Excel em Python, com foco na leitura de planilhas específicas e na recuperação de valores de células usando a biblioteca pandas. Esse conhecimento permitirá que você trabalhe com eficiência com dados do Excel em seus projetos Python.

Como manipular dados do Excel

Nesta seção, discutiremos como atualizar valores de células e adicionar ou excluir linhas e colunas em um arquivo do Excel usando Python. Para esses exemplos, usaremos o OpenPyXL, pois ele oferece vários métodos que você pode usar para alterar ou inserir dados em uma pasta de trabalho do Excel.

Atualizar valores de células

Para modificar os valores das células do Excel, usaremos a biblioteca openpyXL. Em seguida, importe o módulo necessário e carregue a pasta de trabalho do Excel:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Selecione a planilha do Excel que você gostaria de manipular.

sheet = workbook.active

O método ativo seleciona a primeira planilha na pasta de trabalho. Se você quiser selecionar uma planilha diferente, use o formato de pasta de trabalho [< nome da planilha >] .

Para alterar o valor de uma célula, basta atribuir um novo valor à célula desejada:

sheet['A1'] = "New Value"

Finalmente, salve a pasta de trabalho modificada:

workbook.save('example_modified.xlsx')

Adicionar e excluir linhas e colunas

Adicionar e excluir linhas ou colunas pode ser feito facilmente com o OpenPyXL. Veja como:

Adicionar Linhas: Para inserir linhas, use a função insert_rows() . O exemplo a seguir adiciona duas linhas após a primeira linha:

sheet.insert_rows(2, 2)

Excluir linhas: Para excluir linhas, use a função delete_rows() . O exemplo a seguir exclui duas linhas a partir da linha 3:

sheet.delete_rows(3, 2)

Adicionar colunas: Para inserir colunas, use a função insert_cols() . O exemplo a seguir adiciona duas colunas após a primeira coluna:

sheet.insert_cols(2, 2)

Excluir colunas: Para excluir colunas, use a função delete_cols() . O exemplo a seguir exclui duas colunas a partir da coluna 3:

sheet.delete_cols(3, 2)

Lembre-se de salvar a pasta de trabalho atualizada:

workbook.save('example_modified.xlsx')

Como salvar um arquivo do Excel em Python

Para salvar um arquivo do Excel em Python, você pode utilizar bibliotecas como Pandas ou openpyxl. Ambas as bibliotecas oferecem métodos diferentes para gravar dados em arquivos do Excel. Nesta seção, exploraremos cada abordagem e forneceremos exemplos de como salvar um arquivo Excel usando Python.

Usando Pandas: Pandas é uma biblioteca popular para manipulação e análise de dados. Ele possui um método interno chamado to_excel() que permite salvar um DataFrame como um arquivo do Excel:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

Neste exemplo, criamos um DataFrame de amostra e o salvamos como um arquivo Excel chamado “output.xlsx” usando o método to_excel() . Você pode ver a planilha resultante abaixo.

Como abrir um arquivo do Excel em Python: passo a passo

Usando OpenPyXL: openpyxl é outra biblioteca poderosa projetada especificamente para trabalhar com arquivos do Microsoft Excel. Aqui está um exemplo de como salvar dados em um arquivo do Excel usando o OpenPyXL:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

Neste exemplo, criamos uma nova pasta de trabalho e adicionamos dados à planilha ativa usando o método append() . Por fim, salvamos a pasta de trabalho como um arquivo do Excel chamado “ output_openpyxl.xlsx “.

Como abrir um arquivo do Excel em Python: passo a passo

Tanto o Pandas quanto o openpyxl fornecem funcionalidade robusta para salvar arquivos do Excel em Python. Portanto, sua escolha depende dos requisitos e da complexidade de suas tarefas.

Hora de encerrar as coisas

Neste artigo, exploramos diferentes bibliotecas para abrir e trabalhar com arquivos do Excel em Python. Cada uma dessas bibliotecas tem seus próprios recursos e vantagens exclusivos, permitindo que você execute tarefas como ler e gravar dados, acessar planilhas e manipular valores de células.

Ao incorporar os métodos discutidos neste artigo, você pode trabalhar com eficiência com arquivos do Excel, expandir os recursos de seus projetos e aprimorar suas habilidades de análise e manipulação de dados.

À medida que continuar a usar essas bibliotecas e explorar suas funcionalidades, você se tornará mais proficiente no manuseio de planilhas com Python. Este artigo agora equipou você com as habilidades necessárias para realizar o trabalho. É hora de testar suas novas habilidades!

Leave a Comment

Colunas calculadas no SharePoint | Uma visão geral

Colunas calculadas no SharePoint | Uma visão geral

Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.

Atributos pré-atentivos: como isso pode afetar seu relatório

Atributos pré-atentivos: como isso pode afetar seu relatório

Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.

Variáveis ​​e expressões dentro do editor do Power Query

Variáveis ​​e expressões dentro do editor do Power Query

Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

Como salvar e carregar um arquivo RDS em R

Como salvar e carregar um arquivo RDS em R

Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.