Quest-ce que le self en Python ? Exemples concrets
Qu'est-ce que le self en Python ? Exemples concrets
Dans cet article, nous allons voir comment charger des exemples d'ensembles de données en Python. Cela peut ne pas sembler être le sujet le plus glamour, mais c'est en fait assez important. Idéalement, vous aurez des ensembles de données en Python sur lesquels vous pourrez vous exercer lorsque vous apprendrez de nouveaux concepts. Vous pouvez regarder la vidéo complète de ce tutoriel au bas de ce blog.
Si vous avez l'intention de partager votre code , de documenter ce que vous avez fait ou d'avoir besoin d'aide , c'est vraiment une bonne idée d'utiliser un ensemble de données généralement disponible pour créer quelque chose que l'on appelle un exemple minimalement reproductible .
Vous allez avoir un code ou un script pré-groupé que quelqu'un d'autre sur Internet peut exécuter et vous aider. Si vous ne produisez pas ces exemples minimalement reproductibles , vous vous retrouvez dans des endroits comme Stack Overflow, ce qui peut être un peu choquant si vous ne le connaissez pas.
Examinons quelques façons de créer ces exemples peu reproductibles et d'obtenir les ensembles de données. Il existe quelques packages que vous pouvez utiliser pour charger un ensemble de données prédéfini dans Python et partager ce code.
Nous allons examiner trois packages qui sont les plus courants. Allumons un cahier Jupyter vierge et commençons.
Table des matières
Charger des ensembles de données en Python à partir de Sklearn
Le premier que nous allons examiner s'appelle Sklearn . Si vous utilisez Anaconda, vous n'aurez pas besoin de le télécharger. Si vous souhaitez plus d'aide avec Python, LuckyTemplates propose un auquel vous pouvez vous inscrire.
Je vais supposer que vous connaissez déjà des choses comme les packages, et partir de là. Nous allons apporter des pandas et Sklearn, en particulier le sous-module de jeu de données.
Nous allons apporter quelques-uns de ces ensembles de données. Scikit-learn – une bibliothèque de données d'apprentissage automatique – les appelle des ensembles de données de jouets. Nous allons charger Boston, qui est un ensemble de données sur les prix des logements. Lorsque nous apportons cela, nous devons l'avoir comme cadre de données.
Nous devons en fait spécifier que les données et les colonnes proviennent de l'ensemble de données Scikit-learn, et séparer les variables de fonctionnalité et les variables cibles.
Nous allons l'intégrer dans une trame de données afin que nous puissions opérer et faire différentes choses avec. Panda est un excellent package à connaître en tant qu'utilisateur de LuckyTemplates.
Charger des ensembles de données en Python à partir d'ensembles de données Vega
Une autre option que nous pouvons apprendre est le package d'ensembles de données Vega. Celui-ci n'est pas disponible sur Anaconda mais nous pouvons l'installer via PIP. C'est ce que nous allons taper sur la ligne de commande pour installer les jeux de données Vega et pour installer ou importer le module de données local.
Vous pouvez en obtenir certains, mais vous aurez besoin d'une connexion Web. Nous apporterons ceux qui sont installés localement en important des données locales et en les exécutant.
Comme vous pouvez le constater, il existe de nombreux ensembles de données. Certaines d'entre elles sont des séries chronologiques, tandis que d'autres comportent des variables catégorielles ou continues. Choisissons le jeu de données cars dans un bloc de données afin de pouvoir exécuter la méthode head dessus.
Maintenant, nous avons un autre exemple d'ensemble de données que nous pouvons utiliser et partager.
Charger des ensembles de données en Python depuis Seaborn
Seaborn est un autre package disponible dans la distribution Anaconda. Par défaut, Seaborn est surtout connu pour la visualisation de données, mais il propose également d'excellents exemples d'ensembles de données que vous pouvez utiliser. C'est ce que nous allons taper pour obtenir des ensembles de données.
Comme vous pouvez le voir, il y a pas mal de jeux de données ici. Nous allons continuer et utiliser l'ensemble de données sur les pingouins et obtenir à nouveau les premières lignes.
Le résultat est un autre ensemble de données sur lequel nous pouvons nous entraîner.
L'idée ici n'est pas seulement d'avoir les ensembles de données sur lesquels s'exercer. Si nous voyons des valeurs manquantes, si nous avons du mal à supprimer des ensembles de données, si nous voulons remplir la variable catégorielle ou montrer un exemple à d'autres personnes sans donner de données sensibles, vous pouvez simplement utiliser l'un de ces ensembles de données accessibles au public qui sont vraiment, vraiment facile pour que les gens l'utilisent et le partagent. C'est l'idée d'un exemple minimalement reproductible.
LuckyTemplates avec Python Scripting pour créer des tableaux de dates
Python dans LuckyTemplates : Comment installer et configurer
Python I pour les utilisateurs de LuckyTemplates - Nouveau cours sur la plateforme de formation LuckyTemplates
Conclusion
Pour récapituler, il existe trois endroits où rechercher des exemples d'ensembles de données. Scikit-learn est un package d'apprentissage automatique. C'est un peu plus difficile à convertir, mais si vous faites des choses liées à l'apprentissage automatique, c'est l'endroit où aller. Les ensembles de données Vega ont également un assez bon nombre d'ensembles de données, spécialement si vous utilisez la méthode pour obtenir des ensembles de données à partir du Web, mais il est relativement plus difficile à charger, il vous suffit donc d'utiliser PIP plutôt que de l'avoir pré-installé avec Anaconda. Seaborn est le point idéal car il charge le bloc de données et il est très polyvalent lorsqu'il s'agit d'utiliser des exemples d'ensembles de données et des exemples reproductibles.
Stack Overflow propose également un tutoriel sur la façon d'écrire un bon exemple peu reproductible ou MRE, alors vérifiez-le si vous cherchez à publier quelque chose en ligne.
Savoir où obtenir de bons ensembles de données et partager un bon MRE est une compétence très importante à avoir en tant qu'analyste.
Si vous avez apprécié le contenu couvert dans ce didacticiel particulier, veuillez vous abonner à la chaîne de télévision LuckyTemplates. Nous avons une énorme quantité de contenu qui sort tout le temps de moi-même et d'une gamme de créateurs de contenu - tous dédiés à l'amélioration de la façon dont vous utilisez LuckyTemplates et Power Platform.
Qu'est-ce que le self en Python ? Exemples concrets
Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.
Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.
Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.
Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.
Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.
Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.
Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.
Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.
Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir