Créer des visualisations bivariées dans R à laide de Ggplot2

Créer des visualisations bivariées dans R à laide de Ggplot2

La création de visualisations dans R à l'aide de ggplot2 peut être un moyen puissant d'explorer et de comprendre vos données. Un type courant de visualisation est le diagramme bivarié, qui vous permet d'examiner la relation entre deux variables.

Dans ce didacticiel, vous apprendrez à produire des visualisations bivariées dans R à l'aide de ggplot2. Ce blog se concentrera spécifiquement sur les visualisations qui seraient difficiles à réaliser dans LuckyTemplates mais faciles à faire dans R.

Table des matières

Aperçu

Trois sujets principaux seront abordés dans ce tutoriel. Vous apprendrez à visualiser les distributions d'une variable par groupe et à visualiser les corrélations et les relations par paires.

Une relation par paire fait référence à la relation entre chaque paire de variables dans un ensemble de données donné.

Pour ce tutoriel, vous devez télécharger le package ggplot2 . Une fois cela fait, ouvrez un script R vierge et apportez deux bibliothèques : tidyverse et GGally .

Créer des visualisations bivariées dans R à l'aide de Ggplot2

GGally est une extension de ggplot2. Il est conçu pour réduire la complexité de la combinaison d'objets géométriques avec des données transformées.

Les différentes visualisations bivariées dans R

Une visualisation bivariée montre la relation entre deux variables.

Par exemple, créons une visualisation qui montre la relation entre la ville et l'autoroute. Vous devez utiliser la fonction ggplot() puis attribuer les données appropriées.

La fonction geom_point() est ensuite utilisée pour générer le nuage de points .

Créer des visualisations bivariées dans R à l'aide de Ggplot2

Visualisations dans R montrant la corrélation

La fonction ggcorr() est utilisée pour visualiser la corrélation entre les variables. Cela générera une carte thermique avec les valeurs de corrélation les plus basses aux plus élevées affichées. Vous pouvez encore améliorer la visualisation en ajoutant un argument qui affichera les étiquettes.

Créer des visualisations bivariées dans R à l'aide de Ggplot2

Visualisations dans R montrant une relation par paires

Pour le tracé par paires, vous devez utiliser la fonction ggpairs ( ) .

Étant donné que le bloc de données de cet exemple contient un grand ensemble de données, il doit d'abord être filtré pour n'afficher que des valeurs numériques, sinon les résultats afficheront une erreur.

Pour filtrer les données, utilisez l'opérateur pipe et la fonction select_if() .

Créer des visualisations bivariées dans R à l'aide de Ggplot2

Dans l' onglet Tracés , vous pouvez voir la visualisation par paires générée par le code. Vous pouvez également voir le graphique et la valeur de corrélation entre chaque variable.

Une autre chose que vous pouvez faire avec les tracés par paires est d'ajouter des éléments supplémentaires pour augmenter la visualisation. Vous pouvez ajouter une autre variable et modifier la couleur des données.

Dans ce cas, la colonne de lecteur est ajoutée au code et la fonction de cartographie esthétique est utilisée pour changer sa couleur.

Créer des visualisations bivariées dans R à l'aide de Ggplot2

Lorsque vous exécutez le code, vous verrez que le graphique affiche des nuages ​​de points et les valeurs de corrélation par lecteur. La diagonale montre également la répartition selon chaque lecteur.

Créer des visualisations bivariées dans R à l'aide de Ggplot2

Conclusion

Si vous souhaitez créer des visualisations robustes et basées sur des statistiques telles que des histogrammes, des nuages ​​de points et des boîtes à moustaches, il est recommandé d'utiliser ggplot2 avec GGally.

Le langage de programmation R associé à divers packages de visualisation tels que ggplot2 permet aux utilisateurs de créer des visualisations qui montrent la relation et la corrélation entre les variables.

GGally étend ggplot2 en augmentant plusieurs fonctions qui réduisent la complexité. Si vous essayez de créer des visualisations bivariées et multivariées dans LuckyTemplates, elles s'avéreront être un défi. Cependant, dans le langage de programmation R, il vous suffit d'écrire une seule ligne de code pour arriver au tracé statistique dont vous avez besoin.

Tous mes vœux,

George Mount


Quest-ce que le self en Python ? Exemples concrets

Quest-ce que le self en Python ? Exemples concrets

Qu'est-ce que le self en Python ? Exemples concrets

Comment enregistrer et charger un fichier RDS dans R

Comment enregistrer et charger un fichier RDS dans R

Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.

First N Business Days Revisited - Une solution de langage de codage DAX

First N Business Days Revisited - Une solution de langage de codage DAX

Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.

Introduction au filtrage du contexte dans LuckyTemplates

Introduction au filtrage du contexte dans LuckyTemplates

Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.

Idées de matérialisation pour les caches de données dans DAX Studio

Idées de matérialisation pour les caches de données dans DAX Studio

Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.

Rapports dentreprise à laide de LuckyTemplates

Rapports dentreprise à laide de LuckyTemplates

Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir