Colunas calculadas no SharePoint | Uma visão geral
Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.
Hoje, continuaremos no tópico de comunicação de pesquisa usando o R Notebook. Continuaremos trabalhando em uma estrutura básica que você pode usar para comunicar descobertas de pesquisa usando R. Para a primeira parte desta série sobre comunicação de pesquisa reproduzível , confira aqui .
Índice
Fazendo a hipótese
O próximo passo em nosso relatório é fazer a hipótese . Vamos criar outra seção no painel do visualizador e recolher as outras para que possamos ver os relatórios de alto nível.
Para a hipótese, escreveremos que não há diferença no preço de venda de computadores com e sem CD-ROM.
Criando os métodos no R Notebook
Passaremos para os métodos , que abordarão as técnicas reais que usaremos para responder a essa hipótese. Podemos não precisar fazer nenhum tipo de estatística inferencial. Dependendo do público, faremos um relatório de pesquisa de alto nível neste cenário.
Estaremos dizendo que realizaremos testes de amostra com nível de confiança de 95% e inspecionaremos visualmente a distribuição de preços. Se estiverem aproximadamente normais, faremos o teste.
Depois de salvar nossas hipóteses e métodos, podemos renderizá-los como um arquivo HTML , documento PDF ou documento do Word na guia Visualização .
Assim que enviarmos isso como um HTML, isso é o que veremos na caixa de renderização.
Diz aqui que a saída foi criada, então vamos ao nosso File Explorer para verificar isso. Depois de abri-lo em nosso arquivo HTML, podemos ver que ele se parece muito com o que tínhamos no botão Visualizar.
Não estamos vendo nenhuma mensagem de erro neste momento e também vemos espaço para personalização. Podemos até escrever um livro ou site inteiro usando essas ferramentas com R Markdown e R Notebooks .
Vamos voltar ao nosso roteiro e continuar. Escreveremos os métodos que usaremos, bem como nossos resultados. Basicamente, estamos abrindo o código do nosso plano e deixando claro que não estamos jogando coisas contra a parede apenas para ver o que funciona. Não estamos improvisando quando chegamos aos dados; na verdade, temos um plano.
Há algum benefício em experimentar muitas coisas diferentes, certo? Mas, nessa abordagem, estamos propositalmente dizendo: “Isto é o que faremos e depois faremos”.
Trabalhando com estatísticas descritivas no R Notebook
Vamos fazer nossas estatísticas descritivas . Queremos saber o preço de cada grupo com e sem CD-ROM. Existem algumas maneiras de fazer isso. Chamaremos esse resumo de grupo e traremos esse operador de pipe. Se você não estiver familiarizado com o operador de tubulação, poderá verificar os recursos sobre os quais falei anteriormente.
Em seguida, faremos um resumo e contagem de registros para encontrar o preço médio = preço médio . Por fim, queremos imprimir o resumo do grupo e executá-lo.
E aqui vamos nós. Agora temos nossa mesa.
Como eu disse antes, queremos saber quantas observações existem em cada grupo e qual é o preço médio. Podemos tornar isso totalmente dinâmico com uma referência inline.
Faremos um resumo do grupo e usaremos as operações de ordenação . Filtraremos essa linha e, em seguida, pegaremos um desses valores e o transformaremos em algo que realmente será renderizado em nossa referência inline aqui.
Depois de salvar, vá para o Preview Notebook para ver o resultado.
Construindo visualizações no notebook R
R é muito conhecido por sua capacidade de visualização. Para nossa visualização, usaremos ggplot . Colocaremos o preço no eixo X e criaremos um histograma . Também criaremos pequenos múltiplos para a faceta, o que é bastante fácil de fazer no ggplot .
Poderíamos mudar muitas coisas aqui, como título, plano de fundo, cor etc. Depois de salvar isso, podemos ver o gráfico. Isso não é interativo agora, mas há várias maneiras de torná-lo interativo em R. Para este exemplo, estamos fazendo apenas um gráfico estático.
Nossos resultados mostram algo que se parece com uma distribuição de curva de sino, o que significa que devemos continuar com nossa análise.
Executaremos os resultados do teste T e os conectaremos ao relatório. Adicionaremos outro pedaço de R e o chamaremos de cd_test . Se executarmos isso agora, o resultado conterá muitas informações e será muito difícil extrair elementos individuais dele.
Usaremos uma função de arrumação para colocar isso em um formato tabular. Assim que fizermos um cd_test organizado , ele transformará tudo em uma boa estrutura de tabela. Também poderíamos imprimir isso para realmente mostrar em nosso relatório.
Outra coisa que podemos fazer é encontrar os intervalos de confiança inferior e superior. Não queremos mostrar esta parte porque é apenas encenação.
No geral, parece um documento ativo e dinâmico e é muito melhor do que copiar e colar pontos de dados e tabelas individuais em um relatório. Você pode enviar isso para um colega de trabalho e, idealmente, eles podem apenas clicar em Visualizar para saber o que você fez e poder desenvolver isso.
Terminando com uma Conclusão
Estamos chegando ao final de nosso relatório, então escreveremos a conclusão.
Também poderíamos incluir um apêndice aqui para mostrar nossos recursos. O bom de ter um apêndice é que, se você acabar apresentando ou mostrando isso para alguém, eles perguntarão quem é sua fonte de dados ou como algo foi medido. Todas essas são perguntas válidas, e ter um apêndice com recursos é realmente útil porque você pode simplesmente apontar para o apêndice.
Também podemos incluir uma imagem e usar o texto alternativo . Esta é uma boa prática para basicamente descrever o que uma imagem está mostrando. Se você for um usuário HTML, poderá incorporar esta imagem usando HTML.
Conclusão
Para este tutorial, passamos por um relatório inteiro. Este é um rascunho muito grosseiro, mas conseguimos usar R Markdown para criar uma estrutura para nosso relatório de pesquisa.
Começamos falando sobre reprodutibilidade onde tudo está documentado. Você pode usar R Markdown e esta estrutura para criar coisas como sites, livros e blogs. Quase qualquer tipo de produto que você precise construir como analista pode ser criado usando o RStudio.
Para ler mais, sinta-se à vontade para conferir meu livro chamado Advancing into Analytics . Esta é uma boa introdução básica à análise de dados e análise estatística usando Excel, Python e R. Também tenho cursos sobre R para usuários do LuckyTemplates . Você também pode ver um terceiro curso nesta série em algum momento.
Espero que você tenha aprendido algumas coisas com este tutorial do R Notebook e adoraria ver como você acaba usando essas ferramentas.
Jorge Monte
Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.
Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates
Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.
Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.
Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.
Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.
Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.
O que é self em Python: exemplos do mundo real
Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.
Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.