Analyse de texte à laide de Python : comment identifier les parties du discours

Analyse de texte à laide de Python : comment identifier les parties du discours

Dans ce blog, nous allons vous montrer comment effectuer une analyse de texte à l'aide de Python pour identifier des parties du discours dans des données textuelles dans LuckyTemplates. Nous couvrirons les étapes d'utilisation de Python pour l'analyse de texte et fournirons des exemples et des conseils pour vous aider à démarrer avec vos propres projets d'analyse de texte. Vous pouvez regarder la vidéo complète de ce tutoriel au bas de ce blog.

Table des matières

Données source

Dans ce didacticiel, nous utiliserons un nuage de mots prêt à l'emploi contenant les textes que nous allons évaluer. Ceci est montré sur le côté gauche de l'image ci-dessous. Sur le côté droit, nous avons les filtres pour identifier les différentes parties du discours, par exemple, les adjectifs ou les verbes. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Nous pouvons filtrer les mots qui sont des adverbes, des noms, différents types de noms ou de verbes et des bases verbales. Ceci est très utile lors de la création d'une campagne marketing et de la recherche de mots dans vos avis clients. 

Commençons par ouvrir notre éditeur Power Query

Dans nos données sources, nous avons des colonnes pour les identifiants, l'âge, le titre et le texte de l'avis. Nous allons nous concentrer sur la colonne Review Text , et nous allons l'analyser pour faire notre analyse de texte. Il existe également d'autres catégories qui peuvent être utiles dans notre analyse.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Analyse de texte à l'aide de Python

Commençons par les données normales que nous avons importées. La première chose que nous allons faire est de filtrer les lignes car nous avons beaucoup de données et lorsque nous effectuons une analyse de texte, cela prend du temps. 

Pour filtrer nos données, prenez les 50 premières lignes pour rendre l'analyse du texte un peu plus rapide. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Une fois filtré, accédez à Transformer et exécuter le script Python . Nous allons tout coder ici car il n'y a pas beaucoup de code. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Importation des packages

Apportons deux packages pour notre analyse de texte Python à l'aide de notre éditeur de script Python . Nous allons "importer des pandas en tant que pd" , notre bibliothèque de manipulation de données à enregistrer en tant que variable pd. Et puis « from text blob » , nous allons « importer TextBlob » avec une majuscule entre les mots. 

Nous pouvons toujours documenter ce que nous faisons en mettant une chaîne de document. Écrivons #apporter les bibliothèques essentielles en plus de nos packages.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Renommer la variable

Dans la première ligne de notre script, il y a cette ligne fournie par LuckyTemplates qui dit # 'dataset' contient les données d'entrée pour ce script. Cette ligne indique que nos données sont appelées un ensemble de données. 

Alors changeons cela car cela prend trop de temps pour écrire "dataset". Tapez #change la variable de jeu de données et df = jeu de données dans la ligne suivante.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Maintenant, il est plus court d'écrire notre variable. 

Faire l'analyse de texte

Continuons notre analyse de texte. Rappelez-vous que nos textes de révision sont dans une colonne avec des cellules individuelles. Cette configuration ne nous est pas vraiment utile car nous voulons que tous les textes soient ensemble afin de pouvoir effectuer une analyse dessus. 

Cependant, nous ne voulons pas qu'ils soient joints sans espace, alors commençons notre code par un espace entre guillemets doubles .  

Ensuite, ajoutons .join et isolons notre colonne de texte de révision en utilisant notre variable df , qui contient l'ensemble de données. Tapez 'Review Text' placé à l'intérieur d'une notation entre parenthèses qui isole la colonne. 

Ce code rejoindra tout, mais nous devons le sauvegarder donc créons une variable appelée mots.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Une fois que nous avons tous les mots ensemble, nous pouvons ensuite utiliser notre blob de texte pour commencer à analyser les mots. 

La première chose à faire est de créer nos parties du discours en utilisant la variable blob dont nous avons besoin pour transmettre des mots à un blob de texte. Nous allons utiliser ce blob de texte et transmettre le texte, qui est nos mots . Ceci est tapé comme blob = TextBlob(mots).

Maintenant que nous avons ce blob, nous allons le prendre et créer notre variable parts_of_speech en utilisant blob.tags . Les balises seront les abréviations de chacune des parties du discours. 

Ce que nous allons faire ensuite est de l'enregistrer en tant que bloc de données en utilisant Pandas que nous avons introduit. Appelons-le nos données qui sont égales au pd.DataFrame et nous apportons notre parts_of_speech

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Cliquons sur OK pour exécuter notre code. Après avoir exécuté notre code, nous devrions obtenir un tableau de nos variables. Nous avons l' ensemble de données ou nos données d'origine. Nous avons aussi nos données et le df

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Si vous n'obtenez pas les résultats escomptés, nous vous montrerons les différentes façons d'éviter certaines erreurs que vous pourriez obtenir dans le code.

Correction du code pour l'analyse de texte en Python

Parfois, nous pouvons avoir besoin d'être très explicites en changeant le format du texte qui nous intéresse. 

Nous pouvons le faire en appelant notre variable df , en isolant 'Review Text ' placé à l'intérieur d'une notation entre parenthèses, puis en changeant le type en chaînes en utilisant .astype('str') . Ensuite, enregistrez-le à nouveau dans la variable df

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Cliquez sur OK pour réexécuter le code. Nous devrions obtenir les mêmes résultats que précédemment.

Maintenant, nous voulons ouvrir nos data , la dernière variable que nous avons introduite pour voir à quoi cela ressemble. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Nous devrions avoir tous nos mots séparés par des parties du discours. Nous n'avons pas encore nommé nos colonnes, mais nous pouvons facilement le faire. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Dans l'ancienne version de cette même analyse de texte, j'appelais la première colonne Word et la seconde Abbreviation

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Dans la requête Parts of Speech , nous apportons les mots réels qui correspondent à ces abréviations et nous les connectons tous ensemble.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Maintenant, fermons et appliquons

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Les étapes que nous avons suivies nous ont permis de filtrer les différentes parties du discours que nous avons identifiées à l'aide d'un simple code Python . Cela nous donne ce visuel dans LuckyTemplates où nous pouvons facilement filtrer notre texte en fonction de la catégorie de parties du discours dans laquelle il se trouve. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours


Analyse de texte en Python | Une introduction
Python Fonctions définies par l'utilisateur | Présentation
de la liste Python et de la boucle For dans LuckyTemplates

Conclusion

En tant qu'analyste de données , vous devrez peut-être extraire des informations et une signification à partir de grandes quantités de données textuelles non structurées. Ce que vous avez appris est une approche utile pour comprendre les données textuelles grâce à l'analyse de texte.

Désormais, vous pouvez facilement décomposer le texte en unités plus petites telles que des mots et des phrases, puis analyser ces unités à la recherche de modèles et de relations. Vous pouvez atteindre tous ces objectifs en utilisant l'analyse de texte dans Python et LuckyTemplates. 

Tous mes vœux,


Gestion des erreurs dans Power Automate via le branchement parallèle

Gestion des erreurs dans Power Automate via le branchement parallèle

Découvrez l

Comparaison de tables dans Power Query | Tutoriel LuckyTemplates

Comparaison de tables dans Power Query | Tutoriel LuckyTemplates

Découvrez comment comparer facilement des tables dans Power Query pour signaler les différences et optimiser vos analyses de données.

Colonne fractionnée LuckyTemplates par délimiteurs dans DAX

Colonne fractionnée LuckyTemplates par délimiteurs dans DAX

Dans ce blog, vous découvrirez comment diviser les colonnes dans LuckyTemplates par délimiteurs à l'aide de DAX, une méthode efficace pour gérer des modèles de données complexes.

SELECTEDVALUE DAX Exemple - Sélection de trancheuse de récolte

SELECTEDVALUE DAX Exemple - Sélection de trancheuse de récolte

Découvrez comment récolter une valeur avec SELECTEDVALUE DAX pour des calculs dynamiques dans LuckyTemplates.

Calculer la marge en pourcentage dans LuckyTemplates à laide de DAX

Calculer la marge en pourcentage dans LuckyTemplates à laide de DAX

Calculez la marge en pourcentage à l

Modifier les formats de date à laide de léditeur Power Query

Modifier les formats de date à laide de léditeur Power Query

Dans ce didacticiel, nous allons explorer une méthode rapide pour convertir du texte en formats de date à l

Enregistrer la pièce jointe dun e-mail sur SharePoint avec Power Automate

Enregistrer la pièce jointe dun e-mail sur SharePoint avec Power Automate

Dans ce blog, vous apprendrez à enregistrer automatiquement la pièce jointe d

Comment adapter les cellules Excel au texte : 4 solutions simples

Comment adapter les cellules Excel au texte : 4 solutions simples

Découvrez comment adapter les cellules Excel au texte avec ces 4 solutions simples pour améliorer la présentation de vos données.

Générateur de rapports SSRS : formater les en-têtes dans un rapport paginé

Générateur de rapports SSRS : formater les en-têtes dans un rapport paginé

Dans ce didacticiel SSRS Report Builder, découvrez comment utiliser le générateur d

Thème de couleur dans les rapports LuckyTemplates - Conseils et techniques

Thème de couleur dans les rapports LuckyTemplates - Conseils et techniques

Découvrez les outils pour créer un thème de couleur efficace pour vos rapports LuckyTemplates et améliorer leur apparence.