Quest-ce que le self en Python ? Exemples concrets
Qu'est-ce que le self en Python ? Exemples concrets
Aujourd'hui, nous allons continuer sur le sujet de la communication de la recherche à l'aide de R Notebook. Nous continuerons à travailler sur un cadre de base que vous pouvez utiliser pour communiquer les résultats de la recherche à l'aide de R. Pour la première partie de cette série sur la communication de la recherche reproductible , consultez-la ici .
Table des matières
Faire l'hypothèse
La prochaine étape de notre rapport consiste à formuler l' hypothèse . Nous allons créer une autre section dans le volet de la visionneuse et réduire les autres afin de pouvoir voir les rapports de haut niveau.
Pour l'hypothèse, nous écrirons qu'il n'y a pas de différence dans le prix de vente des ordinateurs avec et sans CD-ROM.
Création des méthodes dans R Notebook
Nous passerons aux méthodes , qui aborderont les techniques réelles que nous utiliserons pour répondre à cette hypothèse. Nous n'avons peut-être pas besoin de faire des statistiques inférentielles. Selon le public, nous ferons un rapport de recherche de haut niveau dans ce scénario.
Nous dirons que nous effectuerons des tests d'échantillonnage à un niveau de confiance de 95 % et que nous inspecterons visuellement la distribution des prix. S'ils sont à peu près normaux, nous effectuerons le test.
Après avoir enregistré notre hypothèse et nos méthodes, nous pouvons les rendre sous forme de fichier HTML , de document PDF ou de document Word à partir de l' onglet Aperçu .
Une fois que nous l'avons envoyé au format HTML, voici ce que nous verrons dans la zone de rendu.
Il est dit ici que la sortie a été créée, alors allons dans notre explorateur de fichiers pour vérifier cela. Une fois que nous l'avons ouvert dans notre fichier HTML, nous pouvons voir que cela ressemble vraiment à ce que nous avions dans le bouton Aperçu.
Nous ne voyons aucun message d'erreur à ce stade et nous voyons également de la place pour la personnalisation. Nous pouvons même écrire un livre entier ou un site Web en utilisant ces outils avec R Markdown et R Notebooks .
Revenons à notre script et continuons. Nous écrirons les méthodes que nous utiliserons ainsi que nos résultats. Notre plan est essentiellement ouvert et nous indiquons clairement que nous ne jetons pas des choses contre un mur juste pour voir ce qui colle. Nous n'improvisons pas lorsque nous arrivons aux données; nous avons en fait un plan.
Il y a des avantages à essayer beaucoup de choses différentes, n'est-ce pas ? Mais dans cette approche, nous disons à dessein : « C'est ce que nous allons faire, et ensuite nous allons le faire.
Travailler sur des statistiques descriptives dans R Notebook
Faisons nos statistiques descriptives . Nous voulons trouver le prix pour chaque groupe avec et sans CD-ROM. Il existe plusieurs façons de procéder. Nous allons appeler ce résumé de groupe et faire venir cet opérateur de pipe. Si vous n'êtes pas familier avec l'opérateur de canalisation, vous pouvez consulter les ressources dont j'ai parlé plus tôt.
Ensuite, nous résumerons et compterons les enregistrements pour trouver le prix moyen = prix moyen . Enfin, nous voudrons imprimer ce résumé de groupe, puis l'exécuter.
Et c'est reparti. Nous avons maintenant notre table.
Comme je l'ai dit plus tôt, nous voulons savoir combien d'observations il y a dans chaque groupe et quel est le prix moyen. Nous pouvons rendre cela totalement dynamique avec une référence en ligne.
Nous ferons un résumé de groupe et utiliserons des opérations tidyverse . Nous allons filtrer cette ligne, puis prendre l'une de ces valeurs et la transformer en quelque chose qui sera réellement rendu dans notre référence en ligne ici.
Après avoir enregistré, accédez à Aperçu du bloc-notes pour voir le résultat.
Création de visualisations dans R Notebook
R est très connu pour sa capacité de visualisation. Pour notre visualisation, nous utiliserons ggplot . Nous placerons le prix sur l'axe des X, puis créerons un histogramme . Nous allons également créer de petits multiples pour la facette, ce qui est en fait assez facile à faire dans ggplot .
Nous pourrions changer beaucoup de choses ici, comme le titre, l'arrière-plan, la couleur, etc. Une fois que nous avons enregistré cela, nous pouvons voir l'intrigue. Ce n'est pas interactif pour le moment, mais il existe de nombreuses façons de le rendre interactif dans R. Pour cet exemple, nous ne faisons qu'un tracé statique.
Nos résultats montrent quelque chose qui ressemble à une distribution de courbe en cloche, ce qui signifie que nous devons poursuivre notre analyse.
Nous exécuterons les résultats du test T et les intégrerons au rapport. Nous allons ajouter un autre bloc R et l'appeler cd_test . Si nous l'exécutons maintenant, le résultat contiendra beaucoup d'informations et il sera très difficile d'en extraire des éléments individuels.
Nous allons utiliser une fonction tidy pour mettre cela dans un format tabulaire. Une fois que nous aurons fait un cd_test bien rangé , cela transformera le tout en une belle structure de table. Nous pourrions également l'imprimer pour l'afficher dans notre rapport.
Une autre chose que nous pourrions faire est de trouver les intervalles de confiance inférieurs et supérieurs. Nous ne voulons pas montrer cette partie car ce n'est qu'une mise en scène.
Dans l'ensemble, cela ressemble à un document en direct et dynamique, et c'est tellement mieux que de copier et coller des points de données et des tableaux individuels dans un rapport. Vous pouvez l'envoyer à un collègue et, idéalement, il n'a qu'à cliquer sur Aperçu pour savoir ce que vous avez fait et pouvoir en tirer parti.
Terminer par une conclusion
Nous approchons de la fin de notre rapport, nous allons donc rédiger la conclusion.
Nous pourrions également inclure une annexe ici pour montrer nos ressources. L'avantage d'avoir une annexe est que si vous finissez par présenter ceci ou par montrer cela à quelqu'un, il vous demandera quelle est votre source de données ou comment quelque chose a été mesuré. Ce sont toutes des questions valables, et avoir une annexe avec des ressources est vraiment utile car vous pouvez alors simplement pointer vers l'annexe.
Nous pourrions également inclure une image et utiliser du texte alternatif . C'est une bonne pratique pour décrire en gros ce qu'une image montre. Si vous êtes un utilisateur HTML, vous pouvez intégrer cette image en utilisant HTML.
Conclusion
Pour ce didacticiel, nous avons en fait parcouru un rapport complet. Il s'agit d'un brouillon très approximatif, mais nous avons réussi à utiliser R Markdown pour créer une structure pour notre rapport de recherche.
Nous avons commencé par parler de reproductibilité où tout est documenté. Vous pouvez utiliser R Markdown et ce framework pour créer des choses comme des sites Web, des livres et des blogs. Presque tous les types de produits que vous devez créer en tant qu'analyste peuvent être créés à l'aide de RStudio.
Pour en savoir plus, n'hésitez pas à consulter mon livre intitulé Advancing into Analytics . Il s'agit d'une bonne introduction de base à l'analyse de données et à l'analyse statistique à l'aide d'Excel, Python et R. J'ai également des cours sur R pour les utilisateurs de LuckyTemplates . Vous pouvez également voir un troisième cours de cette série à un moment donné.
J'espère que vous avez appris certaines choses de ce didacticiel R Notebook et j'aimerais voir comment vous finirez par utiliser ces outils.
George Mount
Qu'est-ce que le self en Python ? Exemples concrets
Vous apprendrez à enregistrer et à charger des objets à partir d'un fichier .rds dans R. Ce blog expliquera également comment importer des objets de R vers LuckyTemplates.
Dans ce didacticiel sur le langage de codage DAX, découvrez comment utiliser la fonction GENERATE et comment modifier dynamiquement le titre d'une mesure.
Ce didacticiel explique comment utiliser la technique Multi Threaded Dynamic Visuals pour créer des informations à partir de visualisations de données dynamiques dans vos rapports.
Dans cet article, je vais parcourir le contexte du filtre. Le contexte de filtrage est l'un des principaux sujets que tout utilisateur de LuckyTemplates doit d'abord connaître.
Je souhaite montrer comment le service en ligne LuckyTemplates Apps peut aider à gérer différents rapports et informations générés à partir de diverses sources.
Découvrez comment calculer les modifications de votre marge bénéficiaire à l'aide de techniques telles que la création de branches de mesure et la combinaison de formules DAX dans LuckyTemplates.
Ce didacticiel abordera les idées de matérialisation des caches de données et comment elles affectent les performances des DAX dans la fourniture de résultats.
Si vous utilisez encore Excel jusqu'à présent, c'est le meilleur moment pour commencer à utiliser LuckyTemplates pour vos besoins en matière de rapports commerciaux.
Qu'est-ce que la passerelle LuckyTemplates ? Tout ce que tu as besoin de savoir