Crie visualizações bivariadas em R usando Ggplot2

Criar visualizações em R usando ggplot2 pode ser uma maneira poderosa de explorar e entender seus dados. Um tipo comum de visualização é o gráfico bivariado, que permite examinar a relação entre duas variáveis.

Neste tutorial, você aprenderá como produzir visualizações bivariadas em R usando ggplot2. Este blog se concentrará especificamente em visualizações que seriam difíceis de executar no LuckyTemplates, mas fáceis de fazer no R.

Índice

Visão geral

Três tópicos principais serão discutidos neste tutorial. Você aprenderá como visualizar as distribuições de uma variável por grupo e como visualizar correlações e relações pareadas.

Um relacionamento pairwise refere-se ao relacionamento entre cada par de variáveis ​​em um determinado conjunto de dados.

Para este tutorial, você precisa baixar o pacote ggplot2 . Uma vez feito isso, abra um script R em branco e traga duas bibliotecas: alignverse e GGally .

Crie visualizações bivariadas em R usando Ggplot2

GGally é uma extensão para ggplot2. Ele foi desenvolvido para reduzir a complexidade de combinar objetos geométricos com dados transformados.

As diferentes visualizações bivariadas em R

Uma visualização bivariada mostra a relação entre duas variáveis.

Como exemplo, vamos criar uma visualização que mostre a relação entre a cidade e a rodovia. Você precisa usar a função ggplot ( ) e depois atribuir os dados apropriados.

A função geom_point() é então usada para gerar o gráfico de dispersão .

Crie visualizações bivariadas em R usando Ggplot2

Visualizações em R mostrando correlação

A função ggcorr() é utilizada para visualizar a correlação entre as variáveis. Isso gerará um mapa de calor com os valores de correlação mais baixos para os mais altos exibidos. Você pode melhorar ainda mais a visualização adicionando um argumento que mostrará os rótulos.

Crie visualizações bivariadas em R usando Ggplot2

Visualizações em R mostrando uma relação de pares

Para o gráfico pairwise, você precisa usar a função ggpairs ( ) .

Como o quadro de dados neste exemplo contém um grande conjunto de dados, primeiro ele precisa ser filtrado para mostrar apenas valores numéricos, caso contrário, os resultados mostrarão um erro.

Para filtrar dados, use o operador pipe e a função select_if ( ) .

Crie visualizações bivariadas em R usando Ggplot2

Na guia Gráficos , você pode ver a visualização pareada gerada pelo código. Você também pode ver o gráfico e o valor da correlação entre cada variável.

Outra coisa que você pode fazer com gráficos de pares é adicionar elementos extras para aumentar a visualização. Você pode adicionar outra variável e alterar a cor dos dados.

Nesse caso, a coluna drive é adicionada ao código e a função de mapeamento estético é usada para alterar sua cor.

Crie visualizações bivariadas em R usando Ggplot2

Ao executar o código, você verá que o gráfico mostra gráficos de dispersão e os valores de correlação por unidade. A diagonal também mostra a distribuição de acordo com cada drive.

Crie visualizações bivariadas em R usando Ggplot2

Conclusão

Se você deseja criar visualizações robustas e com suporte estatístico, como histogramas, gráficos de dispersão e gráficos de caixa, é recomendável usar ggplot2 com GGally.

A linguagem de programação R, juntamente com vários pacotes de visualização, como ggplot2, permite que os usuários criem visualizações que mostram o relacionamento e a correlação entre as variáveis.

O GGally estende o ggplot2 aumentando várias funções que reduzem a complexidade. Se você tentar criar visualizações bivariadas e multivariadas no LuckyTemplates, elas serão um desafio. No entanto, dentro da linguagem de programação R, você só precisa escrever uma única linha de código para chegar ao gráfico estatístico necessário.

Tudo de bom,

Jorge Monte

Leave a Comment

Colunas calculadas no SharePoint | Uma visão geral

Colunas calculadas no SharePoint | Uma visão geral

Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.

Atributos pré-atentivos: como isso pode afetar seu relatório

Atributos pré-atentivos: como isso pode afetar seu relatório

Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.

Variáveis ​​e expressões dentro do editor do Power Query

Variáveis ​​e expressões dentro do editor do Power Query

Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

Como salvar e carregar um arquivo RDS em R

Como salvar e carregar um arquivo RDS em R

Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.