Como fazer gráficos de coordenadas paralelas em Python

Gráficos de coordenadas paralelas são uma ferramenta de visualização útil usada para mostrar relações entre múltiplas variáveis ​​que compartilham os mesmos dados numéricos. No LuckyTemplates, esses gráficos são criados com um código Python muito simples que você pode usar e criar e estilizar facilmente. 

No blog de hoje, aprenderemos como criar plotagens de coordenadas multivariadas ou paralelas usando Python . Percorreremos o processo passo a passo, desde a preparação dos dados até a personalização do gráfico para melhor legibilidade. Você pode assistir ao vídeo completo deste tutorial na parte inferior deste blog

Índice

Gráficos de coordenadas paralelas em Python: amostra 1

Este é o nosso primeiro enredo. Ele mostra nossas três variáveis ​​- Variável A, B e C, e as duas linhas que representam os itens 1 e 2. 

Como fazer gráficos de coordenadas paralelas em Python

Isso significa que temos dois conjuntos de dados, um para o Item 1 e outro para o Item 2. E para cada conjunto de dados, temos nossas três variáveis. 

Vamos olhar os dados para entender melhor como a trama foi estruturada. 

Comece destacando o gráfico. Clique em Dados. 

Como fazer gráficos de coordenadas paralelas em Python

Uma tabela com dados muito simples deve aparecer. Foi criado usando a opção de inserir tabela. Podemos ver que nas colunas estão as Variáveis ​​A, B e C para cada item que estão separadas em cada linha.

Como fazer gráficos de coordenadas paralelas em Python

Temos dados simples, mas podemos transformá-los em algo muito revelador. Por exemplo, em nosso gráfico, podemos determinar que a relação entre os dados é bastante “baixa”. 

Como fazer gráficos de coordenadas paralelas em Python

Para ilustrar, podemos comparar esse gráfico com nossos dados. A variável B no Item 1 é 100 e 115 no Item 2, conforme mostrado no gráfico. 

Também podemos identificar como os itens e variáveis ​​estão relacionados. Por exemplo, podemos ver facilmente que a Variável A é menor que B e que C é a menor entre as três.

Como fazer gráficos de coordenadas paralelas em Python

O código Python da trama

Vamos agora prosseguir com o código Python usado para o gráfico real. 

Comece escolhendo visual Python no painel Visualizações

Como fazer gráficos de coordenadas paralelas em Python

Destaque nosso primeiro gráfico para abrir o editor de script Python . 

Como fazer gráficos de coordenadas paralelas em Python

Primeiro, importamos matplotlib.pyplot e o salvamos como uma variável plt. 

Como fazer gráficos de coordenadas paralelas em Python

Em seguida, trazemos os recursos do pandas.plotting . Pandas serve como uma biblioteca de manipulação de dados no LuckyTemplates. É usado principalmente para manipular dados, mas também possui recursos de plotagem.

Vamos importar parallel_coordinates de pandas.plotting . Parallel_coordinates será a função principal para criar o gráfico. 

Como fazer gráficos de coordenadas paralelas em Python

Fazendo o enredo em Python

Na linha 13, documentamos o que vamos fazer escrevendo # make a plot.

Como fazer gráficos de coordenadas paralelas em Python

Usamos parallel_coordinates e passamos o conjunto de dados. 

Como fazer gráficos de coordenadas paralelas em Python

Na linha 3, podemos ver que o conjunto de dados é criado usando a função pandas.DataFrame ( ) . Em seguida, adicionamos Item, Variável A, Variável B e Variável C, que são refletidos em nossa lista de Valores

Na linha 4, o conjunto de dados é desduplicado usando dataset.drop_duplicates ( ).

Como fazer gráficos de coordenadas paralelas em Python

Podemos ir para o painel Visualizações para ver os Valores que adicionamos.

Como fazer gráficos de coordenadas paralelas em Python

A remoção de qualquer um desses valores afetará nossos recursos visuais. Por exemplo, se removermos a Variável C, as coordenadas mudarão de acordo, mostrando-nos como funcionam os Valores

Como fazer gráficos de coordenadas paralelas em Python

Vamos trazer de volta nossa Variável C marcando a caixa ao lado dela em Dados no painel Campos .

Em seguida, passe a função parallel_coordinates que recebe alguns argumentos diferentes. No nosso caso, leva o conjunto de dados e o Item, que fornecerá o tipo e a dimensão do nosso conjunto de dados.

Como fazer gráficos de coordenadas paralelas em Python

Se removermos Item de nossa função e executá-lo, o visual não funcionará.

Receberemos um erro de script Python dizendo que a função parallel_coordinates ( ) está faltando 1 argumento posicional necessário, que é a class_column. 

Como fazer gráficos de coordenadas paralelas em Python

Então, vamos adicionar Item de volta. Por ser posicional, não precisamos escrever as coordenadas de classe. Podemos executar o código uma vez feito. 

Como fazer gráficos de coordenadas paralelas em Python

Mostrando o enredo em Python

O próximo passo é mostrar o enredo, então na linha 16, documentamos o que vamos fazer escrevendo # show the plot.

Como fazer gráficos de coordenadas paralelas em Python

Lembre-se de que importamos matplotlib.pyplot anteriormente e o salvamos como plt. Fizemos isso porque precisamos da função plt.show() para mostrar nosso gráfico. 

Como fazer gráficos de coordenadas paralelas em Python

Gráficos de coordenadas paralelas em Python: amostra 2

Nosso segundo gráfico é um conjunto de dados de íris mostrando petal_length, petal_width, sepal_length e sepal_width. Tem um pouco mais de estilo em comparação com o primeiro gráfico. 

Como fazer gráficos de coordenadas paralelas em Python

Este conjunto de dados foi criado com código Python. 

Para visualizar nossos dados, clique em Transform data e vá para o iris_dataset. 

Como fazer gráficos de coordenadas paralelas em Python

O conjunto de dados contém colunas para as dimensões — comprimento da sépala , largura da sépala , comprimento da pétala e largura da pétala . Também possui uma coluna para o tipo de espécie

Como fazer gráficos de coordenadas paralelas em Python

O código Python do conjunto de dados

Nossos dados foram trazidos facilmente usando o código Python. Vá para Source para mostrar o script Python. 

Como fazer gráficos de coordenadas paralelas em Python

Nosso código Python tem apenas duas linhas. Na primeira linha, importamos seaborn e salvamos como variável sns . Nomeamos nosso conjunto de dados como iris_dataset e usamos a variável sns para carregar o conjunto de dados usando a função sns.load_dataset('iris')

Como fazer gráficos de coordenadas paralelas em Python

Clique em OK para obter os dados que vimos acima. Navegue pelos dados e, uma vez concluído, podemos fechar o conjunto de dados acessando Fechar e aplicar > Fechar

Como fazer gráficos de coordenadas paralelas em Python

Estilizando Gráficos em Python

Para abrir o editor de script Python para nosso gráfico mais estilizado, clique em nosso segundo gráfico.

Começamos importando matplotlib.pyplot como plt. 

Como fazer gráficos de coordenadas paralelas em Python

Em seguida, usamos a função plt.style.use ('dark_background') para estilizar o visual. 

Como fazer gráficos de coordenadas paralelas em Python

Podemos personalizar facilmente o plano de fundo com base em nosso estilo preferido usando a referência de folha de estilo do matplotlib . No nosso caso, usamos um fundo escuro.

Como fazer gráficos de coordenadas paralelas em Python

Vamos também tentar usar ggplot , que é um estilo comum usado.

Como fazer gráficos de coordenadas paralelas em Python

Se o executarmos, ele nos dará um visual parecido com este. 

Como fazer gráficos de coordenadas paralelas em Python

Em seguida, carregue a função pandas para o gráfico importando parallel_coordinates de pandas.plotting. 

Como fazer gráficos de coordenadas paralelas em Python

Para fazer o gráfico, trazemos o conjunto de dados e definimos nossa espécie como a classe

Como fazer gráficos de coordenadas paralelas em Python

Comparado ao nosso primeiro gráfico, adicionamos um parâmetro adicional que é o mapa de cores para obter cores diferentes. Passe isso usando a variável matplotlib, plt.get_cmap. 

Como fazer gráficos de coordenadas paralelas em Python

Há muitas variáveis ​​de cores do matplotlib para escolher na referência do mapa de cores do matplotlib .

Como fazer gráficos de coordenadas paralelas em Python

Por exemplo, atualmente estamos usando o Conjunto 2 de mapas de cores qualitativos, mas também podemos alterá-lo para outras cores, como hsv de mapas de cores cíclicos. 

Como fazer gráficos de coordenadas paralelas em Python

Clique em executar para obter um gráfico parecido com este. 

Como fazer gráficos de coordenadas paralelas em Python

Hsv não parece muito bom em nossos dados, mas podemos brincar até encontrar o mapa de cores mais adequado para nosso gráfico. 


Correlação Python: Guia para criar
conjuntos de dados visuais em pandas com ProfileReport() | Python no LuckyTemplates
Função Seaborn em Python para visualizar a distribuição de uma variável

Conclusão

Neste tutorial, abordamos os fundamentos da criação de plotagens de coordenadas paralelas em Python. Passamos pelo processo de preparação dos dados, criação do gráfico e personalização do gráfico para melhor legibilidade. 

Os gráficos de coordenadas paralelas são uma ferramenta poderosa para visualizar dados de alta dimensão e podem ser usados ​​em vários campos, incluindo finanças, engenharia e aprendizado de máquina. Agora que sabemos como criar gráficos de coordenadas paralelas em Python , podemos começar a usá-los para entender e visualizar melhor nossos próprios dados.

Tudo de bom,

gaelim holanda

Leave a Comment

Colunas calculadas no SharePoint | Uma visão geral

Colunas calculadas no SharePoint | Uma visão geral

Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.

Atributos pré-atentivos: como isso pode afetar seu relatório

Atributos pré-atentivos: como isso pode afetar seu relatório

Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.

Variáveis ​​e expressões dentro do editor do Power Query

Variáveis ​​e expressões dentro do editor do Power Query

Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

Como salvar e carregar um arquivo RDS em R

Como salvar e carregar um arquivo RDS em R

Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.