Quest-ce que le self en Python ? Exemples concrets
Qu'est-ce que le self en Python ? Exemples concrets
Ce blog montre comment utiliser un diagramme de distribution cumulative , également connu sous le nom de fonction de distribution cumulative empirique ou diagrammes ECDF, et présente les avantages de l'utilisation de cette variation de diagramme par rapport à d'autres types de diagrammes. Vous pouvez regarder la vidéo complète de ce tutoriel au bas de ce blog .
La plupart des gens préfèrent les tracés ECDF aux pour visualiser les données lorsqu'ils tracent directement chaque point de données, et cette fonctionnalité permet à l'utilisateur d'interagir facilement avec le tracé. Aujourd'hui, vous apprendrez à utiliser un ECDF en Python et LuckyTemplates et à améliorer vos présentations et rapports sur la distribution des données.
Table des matières
Types de parcelles de distribution
Je vais commencer par filtrer mes données sur un jour particulier, samedi, et nous pouvons voir ci-dessous tous ces graphiques Python utilisés pour décrire les distributions. Nous avons ici notre tracé ECDF, un histogramme, un tracé KDE et un tracé en boîte.
Tous ces graphiques décriront comment les données sont réparties ou distribuées. Par exemple, si nous descendons et regardons l'histogramme, nous pouvons voir que la plupart de ces grands bacs seront là où se trouvent nos données.
À environ 3,50 $, nous avons le bac le plus élevé pour nos données de conseils dans notre ensemble de données ci-dessous.
Nous pouvons également utiliser un graphique KDE qui nous donne une métrique différente lorsque nous examinons la distribution. L'histogramme traite du nombre qui se trouvera dans ces bacs, tandis que KDE traite de la densité.
Avec un tracé KDE, vous pouvez dire où se trouvent la plupart de nos données en repérant la plus grande densité ou le renflement le plus élevé dans le tracé si vous voulez. Ainsi, dans l'image ci-dessus, nous pouvons dire qu'il est distribué entre 2 $ et 4 $.
Il en va de même dans un diagramme en boîte, qui montre que la distribution est de 2 $ à 4 $, et c'est là que se trouveront la plupart de nos données. Il utilise une médiane, la ligne horizontale divisant la boîte, pour nous donner une idée de l'endroit où se trouve la plus grande distribution.
Et puis, nous avons le tracé ECDF où, sur le côté gauche de l'axe des ordonnées, vous pouvez voir le mot Proportion , représentant nos centiles. Sur la base du graphique, à 3,50 $, nous examinons environ 50 % de nos données, et à 5 $ et moins, 80 % de nos données sont distribuées.
Code de tracé d'histogramme
Maintenant, je vais vous montrer le code de chacune de ces parcelles, en commençant par l'histogramme. Ils ont tous un codage très similaire et reproductible , vous pouvez donc les extraire rapidement en utilisant un code, comme un modèle.
Nous devons d'abord importer Seaborn et l'enregistrer sous sb, suivi de matplotlib.pyplot sous plt. Nous utiliserons un style d'arrière-plan appelé ggplot et cette variable matplotlib pour transmettre différents styles.
Par exemple, dans l'image ci-dessous, nous pouvons voir qu'à la 11ème ligne, nous ajoutons un titre pour l'histogramme et les tailles de ticks dans les lignes suivantes. Les yticks et xticks représentent les tailles x et y en conséquence.
Dans la 14ème ligne, nous utilisons une variable Seaborn pour transmettre la fonction qui apporte ce tracé particulier, comme le histplot dans l'exemple ci-dessus, qui représente un tracé d'histogramme. Nous passons ensuite les données de la 4ème ligne dans la fonction en tant qu'ensemble de données.
Tout ce que vous apportez dans les valeurs représente votre ensemble de données et supprimera les doublons. Ensuite, nous utiliserons x pour les conseils et une teinte qui , avec seaborn, vous permet de séparer vos données par catégorie. Si nous revenons à notre visuel, nous pouvons constater qu'il comporte des catégories, notamment le, le temps ou le fumeur.
Tracé KDEComment
Pour l'intrigue KDE, tout est presque identique. Nous avons seulement besoin de passer un nouveau paramètre appelé shade pour avoir ce look ombré. À part cela, la teinte, les données et le reste sont les mêmes.
Avec le diagramme en boîte, il est principalement similaire aux autres diagrammes, à l'exception de quelques différences mineures. Ici, nous utilisons la fonction boxplot où x est le jour et y les conseils. Nous n'utilisons pas non plus la teinte pour ce tracé.
C'est donc la même structure que le tracé ECDF et la seule différence réside dans la variable Seaborn, où nous passons dans un tracé ECDF et utilisons la teinte comme jour. Mais nous pouvons également changer cette teinte en une autre catégorie que nous avons, comme fumeur.
Si nous passons cette catégorie, nous nous retrouverons avec un tracé ECDF qui a deux lignes différentes. Dans ces distributions, nous pouvons voir que les fumeurs en ont plus en ce qui concerne notre largeur de ligne particulière.
Les non-fumeurs ont cent pour cent de ces données en dessous de 6 $, tandis que les fumeurs l'ont à 6 $. Il est donc intéressant de noter que nos fumeurs peuvent laisser un pourboire plus important un jour particulier.
Styliser les tracés ECDF
Maintenant, nous pouvons styliser davantage nos tracés ECDF pour les rendre plus présentables. Dans l'image ci-dessous, différentes parcelles ECDF. Dans le premier tracé, j'ai agrandi les lignes et utilisé une palette de couleurs différente.
Dans le premier graphique, j'ai utilisé différents paramètres à l'intérieur de la fonction. Comme vous pouvez le voir ci-dessous, j'ai passé dans la palette en été et la largeur de ligne en 5.
J'ai aussi comparé samedi et dimanche, c'est pourquoi il y a deux lignes vertes différentes. Ici, nous pouvons voir que le pourboire de 3 $ se situe au 45e centile pour le dimanche et au 70e centile pour le jeudi, ce qui nous indique que les gens ont tendance à laisser des pourboires plus élevés le dimanche.
Nous pouvons également changer les axes X et Y, échanger la proportion et la pointe à l'intérieur de notre tracé, et changer la palette, comme dans l'image ci-dessous.
Ici, nous pouvons voir que le pourboire de 2 $ est au 20e centile pour dimanche, qui est la ligne violette dans le graphique. Ainsi, les données sont les mêmes avec le tracé ECDF précédent et seule la présentation est différente.
Nous avons maintenant un autre tracé avec le même ensemble de données et conservons les positions des axes d'origine, comme indiqué dans l'image ci-dessus. La différence cette fois est que la direction des lignes est inversée.
Style de tracés ECDF
Si nous regardons le code, tout ce que nous faisons est de passer le paramètre complémentaire égal à vrai. Cette action nous permettra de dire que 80 % de nos données sont distribuées dans la plage de 2 $ et plus, au lieu de dire qu'en dessous de la plage de 2 $, 20 % de nos données sont distribuées. Encore une fois, ce sont les mêmes données avec un aspect ou une façon de les présenter différents.
Et dans notre quatrième et dernier tracé ECDF, nous utilisons Count au lieu de proportion.
Cette approche est utile lorsque nous avons plusieurs parcelles. En regardant la colonne de comptage dans l'image ci-dessous, nous pouvons voir qu'il n'y a pas beaucoup d'observations le vendredi, ce qui nous indique que les gens ne laissent pas beaucoup de pourboires ce jour-là.
ECDF Plots Code Essentials
Si nous regardons le code, vous trouverez Seaborn , qui est l'élément principal pour créer cette intrigue particulière. Nous avons également matplotlib.pyplot pour le style, que vous pouvez enregistrer en tant que variable appelée plt .
Nous pouvons ensuite utiliser cette variable pour créer différents styles pour notre tracé particulier, comme l'ajout de titres et de tailles de police. La partie principale de votre code sera votre fonction de tracé ECDF que nous apportons avec Seaborn.
Nuage de points dans le script R : comment créer et importer
des fonctions Python définies par l'utilisateur | Un aperçu
de GGPLOT2 dans R : Visualisations avec ESQUISSE
Conclusion
C'est ainsi que vous pouvez utiliser différents tracés de distribution, notamment les tracés Histogram, KDE, Box et ECDF. Vous avez également appris quatre manières de présenter un tracé ECDF à l'aide du même ensemble de données. Vous pouvez utiliser n'importe quelle approche en fonction de vos préférences.
Rappelez-vous toujours d'apporter les bibliothèques nécessaires à la création de votre tracé et d'utiliser la bonne fonction. Après cela, il ne s'agit que de modifier les aspects visuels et stylistiques de votre intrigue, comme le positionnement des axes et les teintes.
Tous mes vœux,
Qu'est-ce que le self en Python ? Exemples concrets
Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.
Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.
Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.
Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.
Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.
Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.
Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.
Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.
Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir