Quest-ce que le self en Python ? Exemples concrets
Qu'est-ce que le self en Python ? Exemples concrets
MultiIndex dans Pandas est un objet à plusieurs niveaux ou hiérarchique qui vous permet de sélectionner plusieurs lignes et colonnes dans votre index. Il vous permet également de créer une analyse et une manipulation sophistiquées des données, en particulier pour travailler avec des données de dimension supérieure. Dans ce didacticiel, je vais explorer la fonctionnalité MultiIndex de Pandas. Vous pouvez regarder la vidéo complète de ce tutoriel au bas de ce blog.
L'idée ici est que nous avons un index qui contient également une hiérarchie. Si vous avez déjà utilisé Pandas, vous savez que les blocs de données de Pandas contiennent un index , nous allons donc ajouter des couches supplémentaires à cela. Cela facilitera à la fois l'indexation et le remodelage des données, selon que vous avez effectivement une hiérarchie pour vos données.
Pour un exemple, nous allons utiliser le célèbre jeu de données Gapminder, et il s'agit bien ici d'un MultiIndex. Nous avons une hiérarchie, donc un continent perce les pays, et chaque pays peut percer sur plusieurs années. Ainsi, nous pouvons manipuler cet index et les choses seront beaucoup plus faciles à coder lorsque nous utiliserons ce MultiIndex. Nous allons examiner le découpage et le remodelage de l'ensemble de données Gapminder.
Table des matières
Comment utiliser le multiindex dans les pandas
Nous allons utiliser l'ensemble de données Gapminder. Si vous ne l'avez pas installé, vous souhaitez effectuer une installation PIP de Gapminder. Je vais aussi faire venir des Pandas. J'utilise la distribution Anaconda de Python. Dans ce cas, Pandas sera déjà installé. Nous effectuons une importation Gapminder, puis nous examinerons ces données.
Comme vous pouvez le voir ici, encore une fois, nous avons un index ou une hiérarchie. Je devrais dire que nous avons un continent, un pays, puis une année. Actuellement, l'index est juste numérique comme celui-ci, et nous allons maintenant définir notre propre index. Et la façon dont nous allons le faire est avec Gapminder. Nous allons définir l'indice. Nous allons le définir sur le continent, le pays, puis l'année, en place est égal à ( = ) true .
Cela ne fait que sauvegarder les résultats, nous n'avons donc pas à appeler la variable deux fois, juste un peu plus efficace. Et maintenant, vous verrez que nous avons l'index ici, (contenu, pays, année) et c'est notre multi-index.
Quelques choses que nous pourrions faire ici. Disons, par exemple, que je voulais tout sur le continent européen. Je veux filtrer ou découper cette trame de données. Je peux utiliser gapminder.loc , puis taper en Europe. Vous connaissez peut-être loc. D'autres circonstances dans Pandas, cela fonctionne beaucoup plus facilement lorsque nous le faisons par index.
Maintenant, cela existe dans une hiérarchie. Disons que nous ne voulions que les données du Royaume-Uni. Il semble que nous pourrions simplement découper cela, mais cela va être un problème car lorsque nous indexons cela, nous sommes obligés d'utiliser la hiérarchie. Nous devons commencer par le premier niveau, puis passer au deuxième, puis au troisième, et cetera.
Si je voulais inclure plusieurs niveaux, ce que je peux faire, c'est le passer ici. Je vais faire l'Europe, puis le Royaume-Uni. Je pourrais même aller plus loin et mettre 1997. Et maintenant, nous pouvons voir ici le résultat de cette ligne dans ce cas.
Une autre bonne chose avec le MultiIndex dans Pandas est qu'il est beaucoup plus facile de remodeler les données. Je peux faire gapminder_pivot puis gapminder.unstack . Si j'ai besoin de remodeler cet ensemble de données, pour une raison quelconque, je vais l'imprimer et vous verrez que nous avons maintenant le continent, le pays, puis l'année avec les colonnes.
Maintenant, disons que je voulais faire ça dans la direction opposée. Tout ce que j'aurais à faire, c'est unpivot et nous allons faire gapminder_pivot . Si c'était désempiler, alors c'est empiler gapminder_unpivot.
Maintenant, que se passe-t-il si je veux me débarrasser de cet index, le réinitialiser et le remplacer par autre chose ? Tout ce que j'ai à faire dans ce cas, c'est gapminder_unpivot. Nous allons réinitialiser_index . Nous allons le remettre en place . Nous n'avons pas à économiser sur lui-même. C'est juste un peu plus efficace. Ensuite, gapminder_unpivot.
Imprimez cela et nous revenons à nos données d'origine et nous avons l'index. Le début numérique est à zéro car Python est une indexation basée sur zéro.
Python dans LuckyTemplates : comment installer et configurer
le script Python dans les rapports de données LuckyTemplates
LuckyTemplates avec le script Python pour créer des tables de dates
Conclusion
Pandas a été initialement nommé d'après les données du panel. Il est vraiment destiné à fonctionner avec des données de panel, qui sont un type spécifique de données de séries chronologiques avec plusieurs catégories. Dans ce cas, avoir une hiérarchie a vraiment du sens, non ?
Cela fonctionne très bien si vous travaillez avec des lignes uniques, en essayant de trouver plusieurs colonnes.
En ce qui concerne les performances, il se peut que l'index ne soit pas nécessaire si vous fusionnez, mais nous ne fusionnions pas ici. Nous étions juste en train d'opérer, d'accéder, d'indexer, de remodeler, etc. Cependant, l'efficacité du codage est certainement un gros avantage.
C'est donc tout pour MultiIndex dans Pandas. J'espère que c'est quelque chose que vous pouvez utiliser. Vous avez appris quelque chose d'un peu nouveau sur les pandas aujourd'hui.
Tous mes vœux!
Qu'est-ce que le self en Python ? Exemples concrets
Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.
Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.
Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.
Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.
Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.
Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.
Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.
Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.
Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir