Comment ouvrir un fichier Excel en Python : étape par étape

Comment ouvrir un fichier Excel en Python : étape par étape

Travailler avec des fichiers Excel est une tâche courante dans la vie quotidienne de nombreux professionnels, certains d'entre nous l'adorent et d'autres la détestent. Cependant, Python fournit plusieurs bibliothèques pour rendre ce processus plus simple, plus simple et plus efficace.

La bibliothèque Pandas et openpyxl permettent aux utilisateurs d'ouvrir un fichier Excel en Python. Pandas a une méthode intégrée qui facilite les choses, tandis que openpyxl est idéal lorsque vous avez besoin de plus de contrôle sur la structure et le formatage du fichier.

Dans cet article, nous allons explorer différentes méthodes pour ouvrir et travailler avec des feuilles de calcul en Python à l'aide de ces bibliothèques. Grâce à ces connaissances, vous serez en mesure de traiter et d'analyser efficacement les données Excel à l'aide des puissants outils fournis par le vaste écosystème de Python !

Comment ouvrir un fichier Excel en Python : étape par étape

Table des matières

Quels sont les prérequis ?

Avant de plonger dans le processus d'ouverture d'un fichier Excel en Python, quelques prérequis doivent être en place. Avant tout, vous devez avoir une compréhension de base de la programmation Python, y compris des variables, des fonctions et de l'importation de bibliothèques.

Cela vous aidera à comprendre et à utiliser facilement les exemples de code fournis dans l'article.

En plus des connaissances de base de Python, l'installation des bibliothèques nécessaires est également importante. Il existe plusieurs bibliothèques Python disponibles pour travailler avec des fichiers Excel, notamment :

  • pandas : une puissante bibliothèque de manipulation de données.

  • openpyxl : Une bibliothèque populaire pour lire et écrire des fichiers Excel.

  • xlrd : une bibliothèque pour lire les données et formater les informations à partir de fichiers Excel.

  • xlwt : une bibliothèque pour écrire des données et mettre en forme des informations dans des fichiers Excel.

  • xlutils : une suite d'outils permettant de travailler avec des classeurs Excel, y compris la lecture, l'écriture et la modification de données.

Pour installer l'une des bibliothèques ci-dessus à l'aide de pip, ouvrez l'invite de commande ou le terminal et tapez la commande suivante, en remplaçant ` library_name` par la bibliothèque souhaitée :

pip install 

Une autre condition préalable cruciale est d'avoir une feuille de calcul Excel pour travailler. Vous devez préparer un classeur Excel contenant les données que vous souhaitez manipuler avec Python.

Vous pouvez télécharger des exemples de classeurs à partir de Microsoft et d'autres sites de didacticiels.

Bien que le fichier puisse avoir plusieurs feuilles et différents formats, il est conseillé de commencer avec un simple ensemble de données pour le processus d'apprentissage initial. Vous pouvez vous attaquer aux feuilles de calcul complexes une fois que vous avez acquis plus d'expérience et de compréhension des bibliothèques utilisées.

Comment ouvrir un fichier Excel en Python : étape par étape

Comment installer les bibliothèques requises

Pour travailler avec des feuilles de calcul Excel en Python, vous devez installer les bibliothèques appropriées. Il existe plusieurs bibliothèques disponibles à cet effet, mais deux des plus populaires sont openPyXL et xlrd .

OpenPyXL est une bibliothèque Python qui permet de lire et d'écrire des fichiers Excel (en particulier des fichiers xltm, xlsm, xltx et xlsx). Il ne nécessite pas l'installation de Microsoft Excel et fonctionne sur toutes les plateformes. Pour installer OpenPyXL à l'aide de pip, exécutez la commande suivante dans votre terminal :

pip install openpyxl

D'autre part, xlrd est une autre bibliothèque largement utilisée pour lire des données et mettre en forme des informations à partir de fichiers Excel. Il prend spécifiquement en charge les formats de fichiers xls et xlsx.

Pour installer xlrd en utilisant pip, exécutez la commande suivante dans votre terminal :

pip install xlrd

Une fois la bibliothèque souhaitée installée, on peut procéder à la lecture ou à l'écriture de fichiers Excel en Python. Chaque bibliothèque a ses caractéristiques et sa syntaxe uniques, il est donc essentiel de choisir celle qui correspond le mieux à vos besoins.

2 façons d'ouvrir un fichier Excel en Python

Dans cette section, nous discuterons de deux méthodes populaires pour ouvrir une feuille de calcul Excel. Nous allons explorer comment vous pouvez le faire avec les bibliothèques Pandas et Openpyxl.

1.Utiliser des pandas

Pandas est une puissante bibliothèque d'analyse de données en Python qui fournit des fonctionnalités pratiques pour lire, écrire et manipuler des données à partir de divers formats, y compris les formats de fichier Excel et CSV.

Vous pouvez découvrir ses capacités dans cette vidéo sur Comment rééchantillonner des données de séries chronologiques à l'aide de pandas pour améliorer l'analyse :

Pour ouvrir une feuille de calcul Excel à l'aide de Pandas, suivez les instructions ci-dessous :

  1. Tout d'abord, installez la bibliothèque Pandas si vous ne l'avez pas déjà fait. Vous pouvez l'installer en utilisant pip :

    pip install pandas
    Comment ouvrir un fichier Excel en Python : étape par étape
  2. Ensuite, importez Pandas dans votre script Python et utilisez la fonction read_excel() pour charger le fichier :

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Cela lira la feuille Excel spécifiée dans un Pandas DataFrame, qui peut ensuite être facilement manipulé à l'aide de diverses fonctions intégrées.

Remarque : Si vous ne spécifiez pas de nom de feuille, la bibliothèque pandas importera toutes les feuilles et les stockera dans un dictionnaire. Vous pouvez accéder à ces feuilles en utilisant le nom de la feuille comme clé.

Par exemple, si vous souhaitez récupérer une feuille nommée ' monthly_report ', vous pouvez utiliser le code ci-dessous :

print(df['monthly_report'])

2.Utiliser openpyxl

Openpyxl est une autre bibliothèque populaire en Python pour travailler spécifiquement avec des fichiers Excel. Pour ouvrir un classeur Excel en Python à l'aide d'Openpyxl, suivez les instructions ci-dessous :

  1. Tout d'abord, installez openpyxl si vous ne l'avez pas déjà fait. Vous pouvez l'installer en utilisant pip :

    pip install openpyxl
  2. Ensuite, importez openpyxl dans votre IDE Python et utilisez la fonction load_workbook() pour charger votre classeur Excel :

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Cela chargera le fichier Excel spécifié et donnera accès à ses feuilles, lignes et cellules individuelles, vous permettant de travailler facilement avec ses données.

Pandas et openpyxl sont des bibliothèques puissantes qui vous permettent d'ouvrir et de manipuler efficacement des fichiers Excel en Python. Choisissez celui qui correspond le mieux à vos besoins et exigences spécifiques.

Comment lire des données Excel en Python ?

La lecture de données Excel en Python peut être facilement réalisée à l'aide de la bibliothèque Pandas, qui fournit un ensemble de méthodes puissantes et simples à utiliser pour travailler avec des données tabulaires. Dans cette section, vous apprendrez à lire des données Excel à l'aide de pandas, en vous concentrant sur l'accès à des feuilles spécifiques et en récupérant les valeurs des cellules.

Lire la feuille spécifique

Pour lire une feuille spécifique à partir d'un fichier Excel à l'aide de pandas, il vous suffit de transmettre le nom de la feuille ou l'index de la feuille en tant que paramètre à la méthode read_excel. Voici un exemple:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Cet extrait de code importe la bibliothèque Pandas et spécifie le nom de la feuille de calcul Excel et la feuille à lire. Il lit ensuite la feuille spécifiée à l'aide de la méthode read_excel() et imprime le DataFrame résultant.

Pour importer plusieurs feuilles dans le bloc de données, définissez simplement le paramètre sheet_name sur None. Cela importera toutes les feuilles du classeur dans votre dataframe.

Lire les valeurs des cellules

Une fois que vous avez terminé d'importer des données dans un pandas DataFrame, vous pouvez accéder aux valeurs de cellule individuelles à l'aide de la méthode iat[] du DataFrame . La méthode prend des indices de ligne et de colonne comme arguments.

Voici un exemple :

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Cet extrait de code extrait la valeur de la cellule à l'index de ligne 1 et à l'index de colonne 2 (correspondant à la deuxième ligne et à la troisième colonne) du DataFrame (df) précédemment chargé. Après avoir extrait la valeur de la cellule, il imprime la valeur.

Dans cette section, vous avez appris à lire des données Excel en Python, en mettant l'accent sur la lecture de feuilles spécifiques et la récupération de valeurs de cellules à l'aide de la bibliothèque pandas. Cette connaissance vous permettra de travailler efficacement avec des données Excel dans vos projets Python.

Comment manipuler des données Excel

Dans cette section, nous expliquerons comment mettre à jour les valeurs des cellules et ajouter ou supprimer des lignes et des colonnes dans un fichier Excel à l'aide de Python. Pour ces exemples, nous utiliserons OpenPyXL car il propose plusieurs méthodes que vous pouvez utiliser pour modifier ou insérer des données dans un classeur Excel.

Mettre à jour les valeurs des cellules

Pour modifier les valeurs des cellules Excel, nous utiliserons la bibliothèque openpyXL. Ensuite, importez le module requis et chargez le classeur Excel :

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Sélectionnez la feuille Excel que vous souhaitez manipuler.

sheet = workbook.active

La méthode active sélectionne la première feuille du classeur. Si vous souhaitez sélectionner une autre feuille, utilisez le format classeur [< nom de la feuille >] .

Pour modifier une valeur de cellule, il suffit d'attribuer une nouvelle valeur à la cellule souhaitée :

sheet['A1'] = "New Value"

Enfin, enregistrez le classeur modifié :

workbook.save('example_modified.xlsx')

Ajouter et supprimer des lignes et des colonnes

L'ajout et la suppression de lignes ou de colonnes peuvent être facilement effectués avec OpenPyXL. Voici comment:

Ajouter des lignes : pour insérer des lignes, utilisez la fonction insert_rows() . L'exemple suivant ajoute deux lignes après la première :

sheet.insert_rows(2, 2)

Supprimer des lignes : pour supprimer des lignes, utilisez la fonction delete_rows() . L'exemple suivant supprime deux lignes à partir de la ligne 3 :

sheet.delete_rows(3, 2)

Ajouter des colonnes : pour insérer des colonnes, utilisez la fonction insert_cols() . L'exemple suivant ajoute deux colonnes après la première colonne :

sheet.insert_cols(2, 2)

Supprimer des colonnes : pour supprimer des colonnes, utilisez la fonction delete_cols() . L'exemple suivant supprime deux colonnes à partir de la colonne 3 :

sheet.delete_cols(3, 2)

N'oubliez pas d'enregistrer le classeur mis à jour :

workbook.save('example_modified.xlsx')

Comment enregistrer un fichier Excel en Python

Pour enregistrer un fichier Excel en Python, vous pouvez utiliser des bibliothèques telles que Pandas ou openpyxl. Les deux bibliothèques proposent différentes méthodes pour écrire des données dans des fichiers Excel. Dans cette section, nous allons explorer chaque approche et fournir des exemples sur la façon d'enregistrer un fichier Excel à l'aide de Python.

Utilisation de Pandas : Pandas est une bibliothèque populaire pour la manipulation et l'analyse de données. Il a une méthode intégrée appelée to_excel() qui vous permet d'enregistrer un DataFrame en tant que fichier Excel :


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

Dans cet exemple, nous créons un exemple de DataFrame et l'enregistrons dans un fichier Excel nommé "output.xlsx" à l'aide de la méthode to_excel() . Vous pouvez voir la feuille de calcul résultante ci-dessous.

Comment ouvrir un fichier Excel en Python : étape par étape

Utilisation d'OpenPyXL : openpyxl est une autre bibliothèque puissante spécialement conçue pour travailler avec des fichiers Microsoft Excel. Voici un exemple d'enregistrement de données dans un fichier Excel à l'aide d'OpenPyXL :

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

Dans cet exemple, nous créons un nouveau classeur et ajoutons des données à la feuille de calcul active à l'aide de la méthode append() . Enfin, nous enregistrons le classeur sous la forme d'un fichier Excel nommé " output_openpyxl.xlsx ".

Comment ouvrir un fichier Excel en Python : étape par étape

Pandas et openpyxl fournissent des fonctionnalités robustes pour enregistrer des fichiers Excel en Python. Ainsi, votre choix dépend des exigences et de la complexité de vos tâches.

Il est temps de conclure

Dans cet article, nous avons exploré différentes bibliothèques pour ouvrir et travailler avec des fichiers Excel en Python. Chacune de ces bibliothèques possède ses propres caractéristiques et avantages uniques, vous permettant d'effectuer des tâches telles que la lecture et l'écriture de données, l'accès aux feuilles et la manipulation des valeurs des cellules.

En incorporant les méthodes décrites dans cet article, vous pouvez travailler efficacement avec des fichiers Excel, étendre les capacités de vos projets et améliorer vos compétences en analyse et manipulation de données.

Au fur et à mesure que vous continuerez à utiliser ces bibliothèques et à explorer leurs fonctionnalités, vous deviendrez plus compétent dans la gestion des feuilles de calcul avec Python. Cet article vous a maintenant doté des compétences dont vous avez besoin pour faire le travail. Il est temps de tester vos nouvelles compétences !


Quest-ce que le self en Python ? Exemples concrets

Quest-ce que le self en Python ? Exemples concrets

Qu'est-ce que le self en Python ? Exemples concrets

Comment enregistrer et charger un fichier RDS dans R

Comment enregistrer et charger un fichier RDS dans R

Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.

First N Business Days Revisited - Une solution de langage de codage DAX

First N Business Days Revisited - Une solution de langage de codage DAX

Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.

Introduction au filtrage du contexte dans LuckyTemplates

Introduction au filtrage du contexte dans LuckyTemplates

Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.

Idées de matérialisation pour les caches de données dans DAX Studio

Idées de matérialisation pour les caches de données dans DAX Studio

Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.

Rapports dentreprise à laide de LuckyTemplates

Rapports dentreprise à laide de LuckyTemplates

Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir