Trames de données dans R : apprendre les bases

Trames de données dans R : apprendre les bases

Dans les didacticiels précédents, vous avez découvert les objets, les classes d'objets et les vecteurs . Pour ce didacticiel, vous découvrirez les trames de données dans R.

Les trames de données sont essentiellement des vecteurs combinés pour former des lignes et des colonnes de données.

Trames de données dans R : apprendre les bases

Une colonne est constituée d'un vecteur. Ainsi, dans l'exemple ci-dessus, la première colonne est une colonne de chaîne, suivie d'une colonne numérique, puis d'une colonne logique. Cela ressemble à l'apparence d'un tableau dans LuckyTemplates.

De plus, vous devez vous rappeler que pour les blocs de données, il doit y avoir le même nombre d'éléments pour toutes les colonnes. C'est-à-dire qu'il doit y avoir un nombre constant de lignes.

Lorsque vous utilisez le langage de programmation R , vous travaillez généralement avec des trames de données. Il est donc important de comprendre ce qu'ils sont et comment ils peuvent être utilisés.

Table des matières

Chargement et affichage d'une trame de données expédiée

RStudio est déjà livré avec des trames de données que vous pouvez utiliser. Pour les identifier, vous devez utiliser la fonction data ( ) .

Ouvrez RStudio et exécutez les données ( ) . Vous n'avez pas besoin de placer d'argument entre parenthèses.

Trames de données dans R : apprendre les bases

Une fois cela fait, vous verrez une liste d'ensembles de données intégrés dans R que vous pouvez utiliser.

Trames de données dans R : apprendre les bases

Ils sont vraiment utiles pour pratiquer et se familiariser avec l'utilisation des trames de données dans R.

L'ensemble de données intégré le plus couramment utilisé est iris . Iris est souvent utilisé lors de l'apprentissage de la science des données ou de l'analyse de données en général. Imprimez l'iris pour voir ses données dans la console.

Trames de données dans R : apprendre les bases

Vous pouvez voir qu'il y a beaucoup de données. En faisant défiler vers le haut, vous verrez qu'il est composé de différentes colonnes.

Explorer les trames de données dans R à l'aide de fonctions

L'une des façons d'avoir un meilleur aperçu des données est d'utiliser la fonction view ( ) . Lorsque vous exécutez la vue code (iris) , vous verrez un nouvel onglet contenant un tableau apparaître dans RScript.

Trames de données dans R : apprendre les bases

Ce qui améliore le fonctionnement de la vue ( ) , c'est que vous pouvez apporter des modifications au tableau. Vous pouvez ajuster l'ordre des données en utilisant les flèches sur chaque titre de colonne. Il y a aussi un bouton de filtre.

Vous pouvez également cliquer sur l'icône à côté du filtre pour ouvrir les données dans une nouvelle fenêtre.

Trames de données dans R : apprendre les bases

Cette nouvelle fenêtre est similaire à Power Query où vous pouvez consulter les données sans y toucher. Autrement dit, vous ne pouvez pas entrer ou remplacer des valeurs par-dessus les données existantes.

Une autre fonction utile à connaître est la fonction head() . Cette fonction imprime les premières lignes du jeu de données.

Donc, si vous exécutez head (iris) , vous verrez qu'il n'imprime que les six premières lignes. 

Trames de données dans R : apprendre les bases

C'est très bien lorsque vous voulez donner un meilleur sens à vos données. La console n'est pas débordée, et la présentation des données est plus soignée.

Indexation des trames de données

L'indexation a également été abordée dans un tutoriel précédent sur les vecteurs. Il vous suffit d'utiliser des crochets ( [ ] ) pour indexer une position. Maintenant que les blocs de données sont composés de lignes et de colonnes, vous devez indexer les deux. Le format est nom [ligne, colonne] .

Par exemple, si vous souhaitez indexer la 2e ligne et la 4e colonne du jeu de données iris , exécutez simplement iris [2, 4] .

Trames de données dans R : apprendre les bases

Vous pouvez également indexer une plage de lignes et de colonnes. Tout ce dont vous avez besoin est d'utiliser deux -points ( : ) pour indiquer la plage. Voici un exemple :

Trames de données dans R : apprendre les bases

Vous pouvez également indexer une colonne entière. Utilisez le signe dollar ( $ ) après le nom du jeu de données et indiquez le nom de colonne souhaité. Par exemple, si vous souhaitez indexer la colonne entière nommée Species, exécutez iris$Species .

Trames de données dans R : apprendre les bases

Vous verrez alors que toute la colonne Espèce a été imprimée dans la console.

Affichage des statistiques de trame de données dans R

Comme vous l'avez appris dans les didacticiels précédents, R a été conçu à des fins d'analyse de données, de statistiques et de visualisations. Donc, une autre chose utile à apprendre sur les trames de données dans R est de savoir comment les résumer.

Lorsque vous utilisez la fonction récapitulative ( ) , la console renverra les statistiques récapitulatives pour ces données.

Récapitulatif de l'exécution (iris) . Cela vous donnera des informations de base sur l'ensemble de données en termes de statistiques descriptives.

Trames de données dans R : apprendre les bases

Il existe d'autres packages pour obtenir des statistiques plus récapitulatives telles que l'écart type et l'aplatissement. Mais ceux-ci seront discutés dans les tutoriels suivants.


Créer des vecteurs dans R : un didacticiel pas à pas

Conclusion

Vous avez progressivement appris les composants de R. Tout d'abord, vous avez appris les objets, puis avancé avec les vecteurs, jusqu'à cette leçon sur les blocs de données. Vous avez maintenant affaire à des données plus volumineuses et plus complexes.

Avec les trames de données, vous êtes maintenant mieux familiarisé avec les différents ensembles de données dans R et avez appris à obtenir des informations statistiques de base.

Vous continuerez à apprendre progressivement au fur et à mesure que les prochains didacticiels aborderont les moyens de dimensionner et d'explorer des données plus volumineuses dans R.


Quest-ce que le self en Python ? Exemples concrets

Quest-ce que le self en Python ? Exemples concrets

Qu'est-ce que le self en Python ? Exemples concrets

Comment enregistrer et charger un fichier RDS dans R

Comment enregistrer et charger un fichier RDS dans R

Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.

First N Business Days Revisited - Une solution de langage de codage DAX

First N Business Days Revisited - Une solution de langage de codage DAX

Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Présentez des informations à laide de la technique des visuels dynamiques multi-threads dans LuckyTemplates

Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.

Introduction au filtrage du contexte dans LuckyTemplates

Introduction au filtrage du contexte dans LuckyTemplates

Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Meilleurs conseils pour utiliser les applications dans le service en ligne LuckyTemplates

Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Analyser les changements de marge bénéficiaire au fil du temps - Analytics avec LuckyTemplates et DAX

Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.

Idées de matérialisation pour les caches de données dans DAX Studio

Idées de matérialisation pour les caches de données dans DAX Studio

Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.

Rapports dentreprise à laide de LuckyTemplates

Rapports dentreprise à laide de LuckyTemplates

Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Quest-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir

Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir