Comment utiliser les tracés ECDF en Python et LuckyTemplates

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Ce blog montre comment utiliser un diagramme de distribution cumulative , également connu sous le nom de fonction de distribution cumulative empirique ou diagrammes ECDF, et présente les avantages de l'utilisation de cette variation de diagramme par rapport à d'autres types de diagrammes. Vous pouvez regarder la vidéo complète de ce tutoriel au bas de ce blog .

La plupart des gens préfèrent les tracés ECDF aux pour visualiser les données lorsqu'ils tracent directement chaque point de données, et cette fonctionnalité permet à l'utilisateur d'interagir facilement avec le tracé. Aujourd'hui, vous apprendrez à utiliser un ECDF en Python et LuckyTemplates et à améliorer vos présentations et rapports sur la distribution des données.

Table des matières

Types de parcelles de distribution

Je vais commencer par filtrer mes données sur un jour particulier, samedi, et nous pouvons voir ci-dessous tous ces graphiques Python utilisés pour décrire les distributions. Nous avons ici notre tracé ECDF, un histogramme, un tracé KDE et un tracé en boîte.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Tous ces graphiques décriront comment les données sont réparties ou distribuées. Par exemple, si nous descendons et regardons l'histogramme, nous pouvons voir que la plupart de ces grands bacs seront là où se trouvent nos données.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

À environ 3,50 $, nous avons le bac le plus élevé pour nos données de conseils dans notre ensemble de données ci-dessous.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Nous pouvons également utiliser un graphique KDE qui nous donne une métrique différente lorsque nous examinons la distribution. L'histogramme traite du nombre qui se trouvera dans ces bacs, tandis que KDE traite de la densité.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Avec un tracé KDE, vous pouvez dire où se trouvent la plupart de nos données en repérant la plus grande densité ou le renflement le plus élevé dans le tracé si vous voulez. Ainsi, dans l'image ci-dessus, nous pouvons dire qu'il est distribué entre 2 $ et 4 $.

Il en va de même dans un diagramme en boîte, qui montre que la distribution est de 2 $ à 4 $, et c'est là que se trouveront la plupart de nos données. Il utilise une médiane, la ligne horizontale divisant la boîte, pour nous donner une idée de l'endroit où se trouve la plus grande distribution.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Et puis, nous avons le tracé ECDF où, sur le côté gauche de l'axe des ordonnées, vous pouvez voir le mot Proportion , représentant nos centiles. Sur la base du graphique, à 3,50 $, nous examinons environ 50 % de nos données, et à 5 $ et moins, 80 % de nos données sont distribuées.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Code de tracé d'histogramme

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Maintenant, je vais vous montrer le code de chacune de ces parcelles, en commençant par l'histogramme. Ils ont tous un codage très similaire et reproductible , vous pouvez donc les extraire rapidement en utilisant un code, comme un modèle.

Nous devons d'abord importer  Seaborn  et l'enregistrer sous  sb,  suivi de  matplotlib.pyplot  sous  plt. Nous utiliserons un style d'arrière-plan appelé  ggplot  et cette  variable matplotlib  pour transmettre différents styles.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Par exemple, dans l'image ci-dessous, nous pouvons voir qu'à la 11ème ligne, nous ajoutons un titre pour l'histogramme et les tailles de ticks dans les lignes suivantes. Les  yticks  et  xticks  représentent les tailles x et y en conséquence.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Dans la 14ème ligne, nous utilisons une variable Seaborn pour transmettre la fonction qui apporte ce tracé particulier, comme le  histplot  dans l'exemple ci-dessus, qui représente un tracé d'histogramme. Nous passons ensuite les données de la 4ème ligne dans la fonction en tant qu'ensemble de données.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Tout ce que vous apportez dans les valeurs représente votre ensemble de données et supprimera les doublons. Ensuite, nous utiliserons  pour les conseils et  une  teinte  qui avec seaborn, vous permet de séparer vos données par catégorie. Si nous revenons à notre visuel, nous pouvons constater qu'il comporte des catégories, notamment le, le temps ou le fumeur.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Tracé KDEComment

Pour l'intrigue KDE, tout est presque identique. Nous avons seulement besoin de passer un nouveau paramètre appelé shade pour avoir ce look ombré. À part cela, la teinte, les données et le reste sont les mêmes.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Avec le diagramme en boîte, il est principalement similaire aux autres diagrammes, à l'exception de quelques différences mineures. Ici, nous utilisons la  fonction boxplot  où  x  est le jour et  y  les conseils. Nous n'utilisons pas non plus  la teinte  pour ce tracé.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

C'est donc la même structure que le tracé ECDF et la seule différence réside dans la variable Seaborn, où nous passons dans un tracé ECDF et utilisons la teinte comme jour. Mais nous pouvons également changer cette teinte en une autre catégorie que nous avons, comme fumeur.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Si nous passons cette catégorie, nous nous retrouverons avec un tracé ECDF qui a deux lignes différentes. Dans ces distributions, nous pouvons voir que les fumeurs en ont plus en ce qui concerne notre largeur de ligne particulière.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Les non-fumeurs ont cent pour cent de ces données en dessous de 6 $, tandis que les fumeurs l'ont à 6 $. Il est donc intéressant de noter que nos fumeurs peuvent laisser un pourboire plus important un jour particulier.

Styliser les tracés ECDF

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Maintenant, nous pouvons styliser davantage nos tracés ECDF pour les rendre plus présentables. Dans l'image ci-dessous, différentes parcelles ECDF. Dans le premier tracé, j'ai agrandi les lignes et utilisé une palette de couleurs différente.

Dans le premier graphique, j'ai utilisé différents paramètres à l'intérieur de la fonction. Comme vous pouvez le voir ci-dessous, j'ai passé dans la palette en  été  et la largeur de ligne en  5. 

Comment utiliser les tracés ECDF en Python et LuckyTemplates

J'ai aussi comparé samedi et dimanche, c'est pourquoi il y a deux lignes vertes différentes. Ici, nous pouvons voir que le pourboire de 3 $ se situe au 45e centile pour le dimanche et au 70e centile pour le jeudi, ce qui nous indique que les gens ont tendance à laisser des pourboires plus élevés le dimanche.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Nous pouvons également changer les axes X et Y, échanger la proportion et la pointe à l'intérieur de notre tracé, et changer la palette, comme dans l'image ci-dessous.

Ici, nous pouvons voir que le pourboire de 2 $ est au 20e centile pour dimanche, qui est la ligne violette dans le graphique. Ainsi, les données sont les mêmes avec le tracé ECDF précédent et seule la présentation est différente.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Nous avons maintenant un autre tracé avec le même ensemble de données et conservons les positions des axes d'origine, comme indiqué dans l'image ci-dessus. La différence cette fois est que la direction des lignes est inversée.

Style de tracés ECDF

Si nous regardons le code, tout ce que nous faisons est de passer le paramètre  complémentaire égal à vrai. Cette action  nous permettra de dire que 80 % de nos données sont distribuées dans la plage de 2 $ et plus, au lieu de dire qu'en dessous de la plage de 2 $, 20 % de nos données sont distribuées. Encore une fois, ce sont les mêmes données avec un aspect ou une façon de les présenter différents.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Et dans notre quatrième et dernier tracé ECDF, nous utilisons Count au lieu de proportion.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Cette approche est utile lorsque nous avons plusieurs parcelles. En regardant la colonne de comptage dans l'image ci-dessous, nous pouvons voir qu'il n'y a pas beaucoup d'observations le vendredi, ce qui nous indique que les gens ne laissent pas beaucoup de pourboires ce jour-là.

Comment utiliser les tracés ECDF en Python et LuckyTemplates

ECDF Plots Code Essentials

Si nous regardons le code, vous trouverez  Seaborn , qui est l'élément principal pour créer cette intrigue particulière. Nous avons également  matplotlib.pyplot  pour le style, que vous pouvez enregistrer en tant que variable appelée  plt .

Comment utiliser les tracés ECDF en Python et LuckyTemplates

Nous pouvons ensuite utiliser cette variable pour créer différents styles pour notre tracé particulier, comme l'ajout de titres et de tailles de police. La partie principale de votre code sera votre fonction de tracé ECDF que nous apportons avec Seaborn.


Nuage de points dans le script R : comment créer et importer
des fonctions Python définies par l'utilisateur | Un aperçu
de GGPLOT2 dans R : Visualisations avec ESQUISSE

Conclusion

C'est ainsi que vous pouvez utiliser différents tracés de distribution, notamment les tracés Histogram, KDE, Box et ECDF. Vous avez également appris quatre manières de présenter un tracé ECDF à l'aide du même ensemble de données. Vous pouvez utiliser n'importe quelle approche en fonction de vos préférences.

Rappelez-vous toujours d'apporter les bibliothèques nécessaires à la création de votre tracé et d'utiliser la bonne fonction. Après cela, il ne s'agit que de modifier les aspects visuels et stylistiques de votre intrigue, comme le positionnement des axes et les teintes.

Tous mes vœux,


Quest-ce que le self en Python ? Exemples concrets

Quest-ce que le self en Python ? Exemples concrets

Qu'est-ce que le self en Python ? Exemples concrets

Comment enregistrer et charger un fichier RDS dans R

Comment enregistrer et charger un fichier RDS dans R

Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.

First N Business Days Revisited - Une solution de langage de codage DAX

First N Business Days Revisited - Une solution de langage de codage DAX

Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.

Introduction au filtrage du contexte dans LuckyTemplates

Introduction au filtrage du contexte dans LuckyTemplates

Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.

Idées de matérialisation pour les caches de données dans DAX Studio

Idées de matérialisation pour les caches de données dans DAX Studio

Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.

Rapports dentreprise à laide de LuckyTemplates

Rapports dentreprise à laide de LuckyTemplates

Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir