Comunicando pesquisas com o R Notebook - Parte 2

Hoje, continuaremos no tópico de comunicação de pesquisa usando o R Notebook. Continuaremos trabalhando em uma estrutura básica que você pode usar para comunicar descobertas de pesquisa usando R. Para a primeira parte desta série sobre comunicação de pesquisa reproduzível , confira aqui .

Índice

Fazendo a hipótese

O próximo passo em nosso relatório é fazer a hipótese . Vamos criar outra seção no painel do visualizador e recolher as outras para que possamos ver os relatórios de alto nível.

Para a hipótese, escreveremos que não há diferença no preço de venda de computadores com e sem CD-ROM.

Comunicando pesquisas com o R Notebook - Parte 2

Criando os métodos no R Notebook

Passaremos para os métodos , que abordarão as técnicas reais que usaremos para responder a essa hipótese. Podemos não precisar fazer nenhum tipo de estatística inferencial. Dependendo do público, faremos um relatório de pesquisa de alto nível neste cenário.

Estaremos dizendo que realizaremos testes de amostra com nível de confiança de 95% e inspecionaremos visualmente a distribuição de preços. Se estiverem aproximadamente normais, faremos o teste.

Comunicando pesquisas com o R Notebook - Parte 2

Depois de salvar nossas hipóteses e métodos, podemos renderizá-los como um arquivo HTML , documento PDF ou documento do Word na guia Visualização .

Comunicando pesquisas com o R Notebook - Parte 2

Assim que enviarmos isso como um HTML, isso é o que veremos na caixa de renderização.

Comunicando pesquisas com o R Notebook - Parte 2

Diz aqui que a saída foi criada, então vamos ao nosso File Explorer para verificar isso. Depois de abri-lo em nosso arquivo HTML, podemos ver que ele se parece muito com o que tínhamos no botão Visualizar.

Comunicando pesquisas com o R Notebook - Parte 2

Não estamos vendo nenhuma mensagem de erro neste momento e também vemos espaço para personalização. Podemos até escrever um livro ou site inteiro usando essas ferramentas com R Markdown e R Notebooks .

Vamos voltar ao nosso roteiro e continuar. Escreveremos os métodos que usaremos, bem como nossos resultados. Basicamente, estamos abrindo o código do nosso plano e deixando claro que não estamos jogando coisas contra a parede apenas para ver o que funciona. Não estamos improvisando quando chegamos aos dados; na verdade, temos um plano.

Há algum benefício em experimentar muitas coisas diferentes, certo? Mas, nessa abordagem, estamos propositalmente dizendo: “Isto é o que faremos e depois faremos”.

Comunicando pesquisas com o R Notebook - Parte 2

Trabalhando com estatísticas descritivas no R Notebook

Vamos fazer nossas estatísticas descritivas . Queremos saber o preço de cada grupo com e sem CD-ROM. Existem algumas maneiras de fazer isso. Chamaremos esse resumo de grupo e traremos esse operador de pipe. Se você não estiver familiarizado com o operador de tubulação, poderá verificar os recursos sobre os quais falei anteriormente.

Em seguida, faremos um resumo e contagem de registros para encontrar o preço médio = preço médio . Por fim, queremos imprimir o resumo do grupo e executá-lo.

Comunicando pesquisas com o R Notebook - Parte 2

E aqui vamos nós. Agora temos nossa mesa.

Comunicando pesquisas com o R Notebook - Parte 2

Como eu disse antes, queremos saber quantas observações existem em cada grupo e qual é o preço médio. Podemos tornar isso totalmente dinâmico com uma referência inline.

Faremos um resumo do grupo e usaremos as operações de ordenação . Filtraremos essa linha e, em seguida, pegaremos um desses valores e o transformaremos em algo que realmente será renderizado em nossa referência inline aqui.

Comunicando pesquisas com o R Notebook - Parte 2

Depois de salvar, vá para o Preview Notebook para ver o resultado.

Comunicando pesquisas com o R Notebook - Parte 2

Comunicando pesquisas com o R Notebook - Parte 2

Construindo visualizações no notebook R

R é muito conhecido por sua capacidade de visualização. Para nossa visualização, usaremos ggplot . Colocaremos o preço no eixo X e criaremos um histograma . Também criaremos pequenos múltiplos para a faceta, o que é bastante fácil de fazer no ggplot .

Comunicando pesquisas com o R Notebook - Parte 2

Comunicando pesquisas com o R Notebook - Parte 2

Poderíamos mudar muitas coisas aqui, como título, plano de fundo, cor etc. Depois de salvar isso, podemos ver o gráfico. Isso não é interativo agora, mas há várias maneiras de torná-lo interativo em R. Para este exemplo, estamos fazendo apenas um gráfico estático.

Comunicando pesquisas com o R Notebook - Parte 2

Nossos resultados mostram algo que se parece com uma distribuição de curva de sino, o que significa que devemos continuar com nossa análise.

Executaremos os resultados do teste T e os conectaremos ao relatório. Adicionaremos outro pedaço de R e o chamaremos de cd_test . Se executarmos isso agora, o resultado conterá muitas informações e será muito difícil extrair elementos individuais dele.

Usaremos uma função de arrumação para colocar isso em um formato tabular. Assim que fizermos um cd_test organizado , ele transformará tudo em uma boa estrutura de tabela. Também poderíamos imprimir isso para realmente mostrar em nosso relatório.

Comunicando pesquisas com o R Notebook - Parte 2

Outra coisa que podemos fazer é encontrar os intervalos de confiança inferior e superior. Não queremos mostrar esta parte porque é apenas encenação.

Comunicando pesquisas com o R Notebook - Parte 2

No geral, parece um documento ativo e dinâmico e é muito melhor do que copiar e colar pontos de dados e tabelas individuais em um relatório. Você pode enviar isso para um colega de trabalho e, idealmente, eles podem apenas clicar em Visualizar para saber o que você fez e poder desenvolver isso.

Terminando com uma Conclusão

Estamos chegando ao final de nosso relatório, então escreveremos a conclusão.

Comunicando pesquisas com o R Notebook - Parte 2

Também poderíamos incluir um apêndice aqui para mostrar nossos recursos. O bom de ter um apêndice é que, se você acabar apresentando ou mostrando isso para alguém, eles perguntarão quem é sua fonte de dados ou como algo foi medido. Todas essas são perguntas válidas, e ter um apêndice com recursos é realmente útil porque você pode simplesmente apontar para o apêndice.

Comunicando pesquisas com o R Notebook - Parte 2

Também podemos incluir uma imagem e usar o texto alternativo . Esta é uma boa prática para basicamente descrever o que uma imagem está mostrando. Se você for um usuário HTML, poderá incorporar esta imagem usando HTML.

Comunicando pesquisas com o R Notebook - Parte 2

Conclusão

Para este tutorial, passamos por um relatório inteiro. Este é um rascunho muito grosseiro, mas conseguimos usar R Markdown para criar uma estrutura para nosso relatório de pesquisa.

Começamos falando sobre reprodutibilidade onde tudo está documentado. Você pode usar R Markdown e esta estrutura para criar coisas como sites, livros e blogs. Quase qualquer tipo de produto que você precise construir como analista pode ser criado usando o RStudio.

Para ler mais, sinta-se à vontade para conferir meu livro chamado Advancing into Analytics . Esta é uma boa introdução básica à análise de dados e análise estatística usando Excel, Python e R. Também tenho cursos sobre R para usuários do LuckyTemplates . Você também pode ver um terceiro curso nesta série em algum momento.

Comunicando pesquisas com o R Notebook - Parte 2

Espero que você tenha aprendido algumas coisas com este tutorial do R Notebook e adoraria ver como você acaba usando essas ferramentas.

Jorge Monte

Leave a Comment

Colunas calculadas no SharePoint | Uma visão geral

Colunas calculadas no SharePoint | Uma visão geral

Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.

Atributos pré-atentivos: como isso pode afetar seu relatório

Atributos pré-atentivos: como isso pode afetar seu relatório

Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.

Variáveis ​​e expressões dentro do editor do Power Query

Variáveis ​​e expressões dentro do editor do Power Query

Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

Como salvar e carregar um arquivo RDS em R

Como salvar e carregar um arquivo RDS em R

Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.