Criando um gráfico de jitter usando Ggplot2 no RStudio

O pacote ggplot2 é a maneira mais abrangente de construir gráficos e plotagens. Empresas, como o New York Times e The Economist, estão usando fortemente o ggplot2 para criar suas visualizações. Com grandes empresas usando essa ferramenta, é importante ter uma base de conhecimento sobre como usar o ggplot2 para criar visualizações como o gráfico de jitter.

Neste tutorial, você aprenderá como criar um gráfico de jitter usando ggplot2 no . Depois de entender a gramática dos gráficos no ggplot2, você poderá encadear qualquer gráfico ou plotagem.

Um jitterplot é um tipo de gráfico de dispersão usado para exibir a distribuição de um conjunto de pontos de dados numéricos. O “jitter” no nome do gráfico refere-se à variação aleatória que é adicionada à posição de cada símbolo ao longo dos eixos x e y.

Essa variação ajuda a evitar que os símbolos se sobreponham e facilita a visualização da distribuição dos pontos de dados em casos de alta densidade de pontos em determinadas áreas do gráfico.

Se você tiver um gráfico densamente preenchido, um jitterplot pode tornar sua visualização mais fácil de entender. Você também pode usá-lo para traçar distribuições por categoria, que é uma alternativa para um box plot ou um histograma .

Índice

Criando um gráfico de jitter em R

Para esta demonstração, o conjunto de dados do dirtverse é usado.

Criando um gráfico de jitter usando Ggplot2 no RStudio

Primeiro, crie um gráfico de dispersão usando a função ggplot ( ) . Nesse caso, o eixo x é o ano, enquanto o eixo y é o conjunto de dados mpg.

Criando um gráfico de jitter usando Ggplot2 no RStudio

Ao executar o código, você pode ver que o gráfico mostra pontos formando uma linha reta em relação ao eixo y.

Criando um gráfico de jitter usando Ggplot2 no RStudio

Use a função geom_jitter ( ) para adicionar outra camada ao gráfico. Ao executar o código, você verá que os pontos no gráfico mudaram. Os pontos continuarão a mudar toda vez que você executar o código.

Criando um gráfico de jitter usando Ggplot2 no RStudio

Para evitar que os pontos mudem constantemente, use a função set.seed ( ) . Dentro dos parênteses, digite qualquer número aleatório. Nesse caso, é 1234. Depois de executar o código, você verá que o gráfico permanece o mesmo, mesmo se você clicar repetidamente em Executar.

Criando um gráfico de jitter usando Ggplot2 no RStudio

Criando um gráfico de jitter com variáveis ​​categóricas

Você também pode usar a função geom_jitter ( ) para variáveis ​​categóricas.

Usando o mesmo argumento, vamos mudar o eixo x para mpg e o eixo y para origin. Ao executar a nova linha de código, você pode ver que, em vez de mostrar os dados em linhas retas, eles são distribuídos aleatoriamente no gráfico.

Criando um gráfico de jitter usando Ggplot2 no RStudio

Isso ajuda a visualizar as observações individuais para cada categoria e como elas variam. Nesse caso, você pode ver a quilometragem típica de uma origem em relação a outra.

Você pode adicionar cor ao gráfico adicionando outro argumento na função aes ( ) . Você também pode definir o tamanho dos pontos para um valor de dados específico em seu conjunto de dados.

Criando um gráfico de jitter usando Ggplot2 no RStudio

Neste exemplo, o gráfico de jitter facilitou a identificação das origens com mais carros e aqueles com melhor quilometragem.

Devido ao tamanho definido no código, o gráfico parece supersaturado. Você pode alterar o tamanho ou a cor dos pontos de dados dependendo de sua preferência ou requisitos de negócios.

Conclusão

Um gráfico de jitter é uma das maneiras de trazer uma nova forma de percepção em suas visualizações. Ele ajuda os usuários a entender melhor o que está acontecendo com os dados. Este gráfico é uma ótima alternativa para o histograma típico ou gráfico de caixa para plotar distribuições.

A capacidade de entender efetivamente a estrutura subjacente de um conjunto de dados torna os gráficos de jitter uma ferramenta valiosa em vários campos, como estatística, análise de dados e aprendizado de máquina. No geral, os gráficos de jitter fornecem uma representação clara e fácil de entender da distribuição de pontos de dados numéricos, tornando-os uma ferramenta poderosa para visualização e análise de dados.

Tudo de bom,

Jorge Monte

Leave a Comment

Colunas calculadas no SharePoint | Uma visão geral

Colunas calculadas no SharePoint | Uma visão geral

Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.

Atributos pré-atentivos: como isso pode afetar seu relatório

Atributos pré-atentivos: como isso pode afetar seu relatório

Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.

Variáveis ​​e expressões dentro do editor do Power Query

Variáveis ​​e expressões dentro do editor do Power Query

Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

Como salvar e carregar um arquivo RDS em R

Como salvar e carregar um arquivo RDS em R

Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.