Quest-ce que le self en Python ? Exemples concrets
Qu'est-ce que le self en Python ? Exemples concrets
Dans ce didacticiel, je vais vous montrer comment vous pouvez transformer des données empilées désordonnées en un format plus organisé. Il existe un moyen assez simple de le faire, et c'est un moyen qui va être incroyablement utile et qui a beaucoup d'applications différentes. Nous allons utiliser le modulo Power Query. Vous pouvez regarder la vidéo complète de ce tutoriel au bas de ce blog.
Ma femme est venue au bureau et a dit qu'elle avait copié un tas d'adresses sur une invitation de calendrier et qu'elle a fini par coller dans ce format. Elle avait 28 adresses e-mail et noms qui se sont retrouvés dans ce genre de format étrange et empilé. C'était une liste de noms avec un tas de guillemets, de virgules, de courrier indésirable et d'adresses e-mail. Elle voulait savoir comment utiliser Power Query pour obtenir cela dans un meilleur format.
Passons donc à Power Query et nous verrons les données brutes. Gardons les données brutes intactes et référençons-les simplement. Nous appellerons ce fichier de référence, TestData .
La première chose que nous allons faire est d'ajouter un index et peu importe qu'il s'agisse d'un index de base zéro ou d'un index de base un. Nous allons simplement utiliser un index de base zéro pour cette démonstration. Il est facile de cliquer sans avoir à passer par d'autres options.
Cela va impliquer un pivot car un pivot prend des lignes et les transforme en colonnes. Dans ce cas, nous voulons prendre cet ensemble de lignes et les transformer en trois colonnes - une pour le prénom, une pour le nom de famille et une pour l'adresse e-mail.
Nous allons les faire pivoter dans les colonnes, mais nous devons avoir un moyen pour que le pivot sache quel élément va dans quelle colonne. C'est là qu'intervient Power Query Modulo.
Table des matières
Gestion des données empilées à l'aide de Power Query Modulo
Modulo nous donne le reste lorsque nous divisons un nombre particulier. Pour accéder à Modulo, nous allons dans l'onglet Ajouter une colonne, puis nous trouverons Standard, cliquez sur la flèche déroulante et faites défiler vers le bas.
Lorsque nous cliquons sur Modulo, cela nous donne une fenêtre contextuelle qui demande le nombre de colonnes que nous voulons. Dans ce cas, nous voulons trois colonnes.
Si nous divisons trois par trois, nous obtenons un avec un reste de zéro. Trois en quatre donne un reste de un, trois en cinq donne un reste de deux, puis trois en six nous donne un reste de zéro. Ainsi, cela produit ce joli motif répétitif que nous pouvons utiliser pour notre pivot.
Mais avant cela, nettoyons les données. Il y a deux façons de procéder. La première est que nous pouvons simplement remplacer les valeurs. Par exemple, pour les citations, nous pouvons simplement mettre la citation ici et la remplacer par rien. Il prendra et nettoiera ces citations.
L'autre façon de faire cela où nous pouvons tout à la fois le nettoyer et économiser quelques étapes est d'utiliser une fonction appelée Text.Remove . Tout d'abord, nous ajoutons une colonne personnalisée, puis nous listons toutes les valeurs dont nous voulons nous débarrasser.
Comme vous pouvez le voir, cela efface tout bien et facilement. Et donc, nous pouvons maintenant nous débarrasser de cette colonne initiale, puis déplacer cette colonne personnalisée.
Nous pouvons maintenant faire notre pivot proprement. Nous prenons le Modulo, allons dans Transform, puis Pivot Column, et nous allons pivoter sur Custom, mais nous ne voulons pas qu'il s'agrège. Nous allons donc choisir Ne pas agréger et cliquer sur OK.
Nous le remplaçons simplement par ces valeurs dans la colonne. Il crée ensuite ces trois colonnes pour nous. Nous pouvons y voir le nom, le prénom et l'adresse e-mail, mais ce n'est pas exactement le format que nous voulons.
Pour résoudre ce problème, nous pouvons prendre ces colonnes, puis effectuer un Fill Up .
Et maintenant, nous avons ces rangées supplémentaires à cause du motif répétitif du Modulo.
Nous pouvons facilement nous en débarrasser en supprimant les rangées alternées. Nous pouvons le faire dans l'option Supprimer les lignes.
Nous pouvons dire que la première ligne à supprimer est deux. Ensuite, supprimez les deuxième et troisième rangées, puis conservez la quatrième et faites-le comme un motif répétitif.
Vous pouvez maintenant voir que nous avons bien nettoyé toutes les données correctes et que nous avons toujours les 28 adresses e-mail d'origine.
Nous pouvons maintenant nous débarrasser de la colonne Index et renommer les en-têtes de colonne en conséquence.
Fonctions LuckyTemplates Modulo et Integer-Divide DAX
Meilleures pratiques de Power Query pour votre modèle de données
Power Query M : modèle 0-1 alterné dans le tableau de dates
Conclusion
Vous pouvez voir qu'avec juste l'astuce Modulo, puis en faisant pivoter les données et avec un peu de nettoyage, c'est assez facile à faire. Une fois que vous avez compris, cela ne prend probablement qu'une minute environ pour tout faire.
Donc, j'espère que cela vous a donné quelques idées et outils supplémentaires. Vous pouvez également consulter mon prochain tutoriel . En cela, nous allons examiner de plus près certaines des choses que nous avons couvertes dans ce didacticiel et également voir comment nous pouvons automatiser ce processus de manière reproductible, en utilisant des fonctions personnalisées. Je vais également vous montrer quelques astuces intéressantes pour déboguer vos fonctions personnalisées.
J'espère que vous avez trouvé cela utile. Vous pouvez regarder la vidéo complète ci-dessous et consulter les liens ci-dessous pour plus de contenu connexe.
Tous mes vœux!
Qu'est-ce que le self en Python ? Exemples concrets
Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.
Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.
Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.
Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.
Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.
Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.
Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.
Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.
Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir