Analyse de texte à laide de Python : comment identifier les parties du discours

Analyse de texte à laide de Python : comment identifier les parties du discours

Dans ce blog, nous allons vous montrer comment effectuer une analyse de texte à l'aide de Python pour identifier des parties du discours dans des données textuelles dans LuckyTemplates. Nous couvrirons les étapes d'utilisation de Python pour l'analyse de texte et fournirons des exemples et des conseils pour vous aider à démarrer avec vos propres projets d'analyse de texte. Vous pouvez regarder la vidéo complète de ce tutoriel au bas de ce blog.

Table des matières

Données source

Dans ce didacticiel, nous utiliserons un nuage de mots prêt à l'emploi contenant les textes que nous allons évaluer. Ceci est montré sur le côté gauche de l'image ci-dessous. Sur le côté droit, nous avons les filtres pour identifier les différentes parties du discours, par exemple, les adjectifs ou les verbes. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Nous pouvons filtrer les mots qui sont des adverbes, des noms, différents types de noms ou de verbes et des bases verbales. Ceci est très utile lors de la création d'une campagne marketing et de la recherche de mots dans vos avis clients. 

Commençons par ouvrir notre éditeur Power Query

Dans nos données sources, nous avons des colonnes pour les identifiants, l'âge, le titre et le texte de l'avis. Nous allons nous concentrer sur la colonne Review Text , et nous allons l'analyser pour faire notre analyse de texte. Il existe également d'autres catégories qui peuvent être utiles dans notre analyse.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Analyse de texte à l'aide de Python

Commençons par les données normales que nous avons importées. La première chose que nous allons faire est de filtrer les lignes car nous avons beaucoup de données et lorsque nous effectuons une analyse de texte, cela prend du temps. 

Pour filtrer nos données, prenez les 50 premières lignes pour rendre l'analyse du texte un peu plus rapide. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Une fois filtré, accédez à Transformer et exécuter le script Python . Nous allons tout coder ici car il n'y a pas beaucoup de code. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Importation des packages

Apportons deux packages pour notre analyse de texte Python à l'aide de notre éditeur de script Python . Nous allons "importer des pandas en tant que pd" , notre bibliothèque de manipulation de données à enregistrer en tant que variable pd. Et puis « from text blob » , nous allons « importer TextBlob » avec une majuscule entre les mots. 

Nous pouvons toujours documenter ce que nous faisons en mettant une chaîne de document. Écrivons #apporter les bibliothèques essentielles en plus de nos packages.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Renommer la variable

Dans la première ligne de notre script, il y a cette ligne fournie par LuckyTemplates qui dit # 'dataset' contient les données d'entrée pour ce script. Cette ligne indique que nos données sont appelées un ensemble de données. 

Alors changeons cela car cela prend trop de temps pour écrire "dataset". Tapez #change la variable de jeu de données et df = jeu de données dans la ligne suivante.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Maintenant, il est plus court d'écrire notre variable. 

Faire l'analyse de texte

Continuons notre analyse de texte. Rappelez-vous que nos textes de révision sont dans une colonne avec des cellules individuelles. Cette configuration ne nous est pas vraiment utile car nous voulons que tous les textes soient ensemble afin de pouvoir effectuer une analyse dessus. 

Cependant, nous ne voulons pas qu'ils soient joints sans espace, alors commençons notre code par un espace entre guillemets doubles .  

Ensuite, ajoutons .join et isolons notre colonne de texte de révision en utilisant notre variable df , qui contient l'ensemble de données. Tapez 'Review Text' placé à l'intérieur d'une notation entre parenthèses qui isole la colonne. 

Ce code rejoindra tout, mais nous devons le sauvegarder donc créons une variable appelée mots.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Une fois que nous avons tous les mots ensemble, nous pouvons ensuite utiliser notre blob de texte pour commencer à analyser les mots. 

La première chose à faire est de créer nos parties du discours en utilisant la variable blob dont nous avons besoin pour transmettre des mots à un blob de texte. Nous allons utiliser ce blob de texte et transmettre le texte, qui est nos mots . Ceci est tapé comme blob = TextBlob(mots).

Maintenant que nous avons ce blob, nous allons le prendre et créer notre variable parts_of_speech en utilisant blob.tags . Les balises seront les abréviations de chacune des parties du discours. 

Ce que nous allons faire ensuite est de l'enregistrer en tant que bloc de données en utilisant Pandas que nous avons introduit. Appelons-le nos données qui sont égales au pd.DataFrame et nous apportons notre parts_of_speech

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Cliquons sur OK pour exécuter notre code. Après avoir exécuté notre code, nous devrions obtenir un tableau de nos variables. Nous avons l' ensemble de données ou nos données d'origine. Nous avons aussi nos données et le df

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Si vous n'obtenez pas les résultats escomptés, nous vous montrerons les différentes façons d'éviter certaines erreurs que vous pourriez obtenir dans le code.

Correction du code pour l'analyse de texte en Python

Parfois, nous pouvons avoir besoin d'être très explicites en changeant le format du texte qui nous intéresse. 

Nous pouvons le faire en appelant notre variable df , en isolant 'Review Text ' placé à l'intérieur d'une notation entre parenthèses, puis en changeant le type en chaînes en utilisant .astype('str') . Ensuite, enregistrez-le à nouveau dans la variable df

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Cliquez sur OK pour réexécuter le code. Nous devrions obtenir les mêmes résultats que précédemment.

Maintenant, nous voulons ouvrir nos data , la dernière variable que nous avons introduite pour voir à quoi cela ressemble. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Nous devrions avoir tous nos mots séparés par des parties du discours. Nous n'avons pas encore nommé nos colonnes, mais nous pouvons facilement le faire. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Dans l'ancienne version de cette même analyse de texte, j'appelais la première colonne Word et la seconde Abbreviation

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Dans la requête Parts of Speech , nous apportons les mots réels qui correspondent à ces abréviations et nous les connectons tous ensemble.

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Maintenant, fermons et appliquons

Analyse de texte à l'aide de Python : comment identifier les parties du discours

Les étapes que nous avons suivies nous ont permis de filtrer les différentes parties du discours que nous avons identifiées à l'aide d'un simple code Python . Cela nous donne ce visuel dans LuckyTemplates où nous pouvons facilement filtrer notre texte en fonction de la catégorie de parties du discours dans laquelle il se trouve. 

Analyse de texte à l'aide de Python : comment identifier les parties du discours


Analyse de texte en Python | Une introduction
Python Fonctions définies par l'utilisateur | Présentation
de la liste Python et de la boucle For dans LuckyTemplates

Conclusion

En tant qu'analyste de données , vous devrez peut-être extraire des informations et une signification à partir de grandes quantités de données textuelles non structurées. Ce que vous avez appris est une approche utile pour comprendre les données textuelles grâce à l'analyse de texte.

Désormais, vous pouvez facilement décomposer le texte en unités plus petites telles que des mots et des phrases, puis analyser ces unités à la recherche de modèles et de relations. Vous pouvez atteindre tous ces objectifs en utilisant l'analyse de texte dans Python et LuckyTemplates. 

Tous mes vœux,


Quest-ce que le self en Python ? Exemples concrets

Quest-ce que le self en Python ? Exemples concrets

Qu'est-ce que le self en Python ? Exemples concrets

Comment enregistrer et charger un fichier RDS dans R

Comment enregistrer et charger un fichier RDS dans R

Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.

First N Business Days Revisited - Une solution de langage de codage DAX

First N Business Days Revisited - Une solution de langage de codage DAX

Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.

Introduction au filtrage du contexte dans LuckyTemplates

Introduction au filtrage du contexte dans LuckyTemplates

Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.

Idées de matérialisation pour les caches de données dans DAX Studio

Idées de matérialisation pour les caches de données dans DAX Studio

Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.

Rapports dentreprise à laide de LuckyTemplates

Rapports dentreprise à laide de LuckyTemplates

Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir