O que é self em Python: exemplos do mundo real
O que é self em Python: exemplos do mundo real
Neste tutorial, você aprenderá como criar uma visualização de gráfico de dispersão usando um script R. Isso se baseia em um relatório enviado para o . Você pode assistir ao vídeo completo deste tutorial na parte inferior deste blog.
Índice
O que é gráfico de dispersão
Um gráfico de dispersão é um tipo de visualização de dados usado para exibir a relação entre duas variáveis contínuas. É um gráfico onde cada ponto de dados é representado por um ponto, e a posição do ponto nos eixos horizontal e vertical corresponde aos valores das duas variáveis.
Os gráficos de dispersão são ferramentas úteis para identificar padrões e tendências nos dados. Adicionar esse visual aos seus relatórios do LuckyTemplates adicionará mais informações aos dados que você está apresentando. Ao final deste tutorial, você será capaz de criar um gráfico de dispersão R semelhante a este:
Esta discussão é dividida em quatro etapas. Primeiro você aprenderá como criar um gráfico de dispersão básico. Em seguida, você aplicará uma linha suave para mostrar a tendência dos dados no gráfico. A terceira e a quarta etapas concentram-se principalmente em temas e alterações de formatação que você pode aplicar ao gráfico de dispersão.
O conjunto de dados usado neste exemplo é uma tabela contendo o nome do cliente, duração, ganhos e taxa horária.
Crie o gráfico de dispersão básico no visual do script R
Abra seu .
Para começar, você precisa ter três pacotes instalados em seu programa RStudio , o alignverse , o ggthemes e o ggpubr .
Caso não os tenha instalado, utilize a função install.packages( ) . Feito isso, você precisa usar a função library( ) para carregá-los no ambiente R.
Copie os códigos R da biblioteca e vá para o LuckyTemplates. Abra o editor R Script e cole o código. Você pode continuar a construir o código R lá.
Em seguida, use a função ggplot( ) para criar um gráfico de dispersão. Você precisa primeiro especificar o conjunto de dados que será usado no gráfico, portanto, o comando database %>% . Nesse caso, um operador de tubo é usado em vez de uma função de filtro.
Para especificar o conjunto de dados, você precisa usar o argumento aes( ) e então especificar seus eixos x e y. Neste caso, é hora de duração e ganhos, respectivamente. Em seguida, use a função geom_point( ) para mostrar os pontos no gráfico.
Você pode ainda fazer alterações de formatação em seu gráfico de dispersão usando uma variedade de funções, como “cor” ou “forma”. Se você deseja aplicar uma aparência dinâmica ao seu gráfico, pode definir a cor e o tamanho do ponto para um valor específico, conforme visto no exemplo.
Ao executar o código, você obterá esse gráfico de dispersão no LuckyTemplates. Observe que você obtém círculos maiores e de cores mais escuras quando o valor da taxa horária equivalente é maior.
Adicionar uma linha suave ao gráfico
Nesta próxima etapa, você aprenderá como adicionar uma linha suave ao gráfico. Uma linha suave é uma linha ajustada aos dados para ajudá-lo a explorar as possíveis relações entre duas variáveis.
Para adicionar uma linha suave, use a função geom_smooth( ) .
Ao executar o script R, o gráfico de dispersão ficará assim. A linha suave agora mostra a tendência dos dados em um intervalo de confiança de 95%.
Você pode alterar a escala dos eixos xey usando as funções scale_x_continuous( ) e scale_y_continuous( ) .
Nesse caso, o eixo y é transformado em uma escala logarítmica, enquanto o eixo x permanece o mesmo.
Quando você executar o código R, os resultados aparecerão logaritmicamente. A linha suave também muda.
Além disso, como o gráfico coloca rótulos automaticamente nos eixos, você pode removê-los usando a função labs( ) .
Formatar a aparência do gráfico de dispersão R
Depois de criar a forma básica do gráfico de dispersão, a próxima etapa é personalizar o tema e a aparência.
Use a função theme( ) para formatar o gráfico de dispersão no editor R Script. E dentro dessa função, você pode adicionar outros argumentos para personalizar.
Panel.grid.major ( ) e panel.grid.minor( ) permitem editar o tipo de linha e a cor das linhas de grade do gráfico. Se você deseja remover uma linha de grade, use a função element_blank( ) .
Panel.background e plot.background são removidos para tornar o gráfico de dispersão transparente . Isso permite a flexibilidade de colocar o gráfico em qualquer lugar do relatório. Se você deseja remover a legenda em seu gráfico, defina a função legend.position como 'none'.
Você também pode formatar a linha e o texto dos eixos x e y. Você pode tornar a linha mais grossa ou mais fina, ou o texto maior ou menor.
Se você quiser aprender sobre outras funções de formatação que você pode usar em seu gráfico, você pode ir para a seção de Ajuda no RStudio . Digite “tema” na barra de pesquisa e uma lista de funções de formatação aparecerá.
Há uma variedade de funções de formatação que você pode usar no R. Lembre-se de usar o que você precisa e não exagere.
Ajuste a cor e o intervalo dos pontos de dados
Na última seção deste tutorial, você aprenderá como formatar a escala de cores e o intervalo de tamanho dos pontos em seu gráfico de dispersão.
A função scale_colour_viridis_b( ) fornece mapas de cores que são perceptivamente uniformes em cores e em preto e branco. Eles também são projetados para serem percebidos por espectadores com formas comuns de daltonismo.
Se você pesquisar na seção Ajuda do RStudio, verá os diferentes argumentos que pode usar para formatar seus gráficos. Você pode alternar entre as opções para descobrir qual resultado se ajusta melhor ao seu relatório.
Por exemplo, a função scale_size_continuous( ) dimensiona o tamanho de pontos ou formas em um gráfico de acordo com uma variável contínua. Ele permite que você especifique os tamanhos de ponto mínimo e máximo que devem ser usados na plotagem.
Nesse caso, 4 é o mínimo, enquanto 17 é o máximo.
Agora é assim que o gráfico de dispersão R final se parece.
Conclusão
Neste tutorial, você aprendeu a criar um gráfico de dispersão R no LuckyTemplates. Um gráfico de dispersão é um tipo de visualização de dados usado para exibir a relação entre duas variáveis contínuas. No LuckyTemplates, você pode criar um gráfico de dispersão usando o pacote ggplot e o visual do R Script.
Os gráficos de dispersão são ferramentas úteis para visualizar e identificar os padrões e tendências nos dados. Eles também são úteis para identificar outliers ou anomalias.
No geral, criar um gráfico de dispersão no LuckyTemplates usando R é um processo simples e permite que você aproveite os poderosos recursos de visualização de dados do pacote ggplot.
Tudo de bom,
Hossein Seyedagha
O que é self em Python: exemplos do mundo real
Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.
Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.
Este tutorial abordará como usar a técnica Multi Threaded Dynamic Visuals para criar insights de visualizações de dados dinâmicos em seus relatórios.
Neste artigo, analisarei o contexto do filtro. O contexto do filtro é um dos principais tópicos sobre os quais qualquer usuário do LuckyTemplates deve aprender inicialmente.
Quero mostrar como o serviço online do LuckyTemplates Apps pode ajudar no gerenciamento de diferentes relatórios e insights gerados de várias fontes.
Aprenda a calcular suas alterações de margem de lucro usando técnicas como ramificação de medida e combinação de fórmulas DAX no LuckyTemplates.
Este tutorial discutirá sobre as ideias de materialização de caches de dados e como elas afetam o desempenho dos DAXs no fornecimento de resultados.
Se você ainda estiver usando o Excel até agora, este é o melhor momento para começar a usar o LuckyTemplates para suas necessidades de relatórios de negócios.
O que é o Gateway do LuckyTemplates? Tudo o que você precisa saber