Colunas calculadas no SharePoint | Uma visão geral
Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.
Gráficos de coordenadas paralelas são uma ferramenta de visualização útil usada para mostrar relações entre múltiplas variáveis que compartilham os mesmos dados numéricos. No LuckyTemplates, esses gráficos são criados com um código Python muito simples que você pode usar e criar e estilizar facilmente.
No blog de hoje, aprenderemos como criar plotagens de coordenadas multivariadas ou paralelas usando Python . Percorreremos o processo passo a passo, desde a preparação dos dados até a personalização do gráfico para melhor legibilidade. Você pode assistir ao vídeo completo deste tutorial na parte inferior deste blog .
Índice
Gráficos de coordenadas paralelas em Python: amostra 1
Este é o nosso primeiro enredo. Ele mostra nossas três variáveis - Variável A, B e C, e as duas linhas que representam os itens 1 e 2.
Isso significa que temos dois conjuntos de dados, um para o Item 1 e outro para o Item 2. E para cada conjunto de dados, temos nossas três variáveis.
Vamos olhar os dados para entender melhor como a trama foi estruturada.
Comece destacando o gráfico. Clique em Dados.
Uma tabela com dados muito simples deve aparecer. Foi criado usando a opção de inserir tabela. Podemos ver que nas colunas estão as Variáveis A, B e C para cada item que estão separadas em cada linha.
Temos dados simples, mas podemos transformá-los em algo muito revelador. Por exemplo, em nosso gráfico, podemos determinar que a relação entre os dados é bastante “baixa”.
Para ilustrar, podemos comparar esse gráfico com nossos dados. A variável B no Item 1 é 100 e 115 no Item 2, conforme mostrado no gráfico.
Também podemos identificar como os itens e variáveis estão relacionados. Por exemplo, podemos ver facilmente que a Variável A é menor que B e que C é a menor entre as três.
O código Python da trama
Vamos agora prosseguir com o código Python usado para o gráfico real.
Comece escolhendo visual Python no painel Visualizações .
Destaque nosso primeiro gráfico para abrir o editor de script Python .
Primeiro, importamos matplotlib.pyplot e o salvamos como uma variável plt.
Em seguida, trazemos os recursos do pandas.plotting . Pandas serve como uma biblioteca de manipulação de dados no LuckyTemplates. É usado principalmente para manipular dados, mas também possui recursos de plotagem.
Vamos importar parallel_coordinates de pandas.plotting . Parallel_coordinates será a função principal para criar o gráfico.
Fazendo o enredo em Python
Na linha 13, documentamos o que vamos fazer escrevendo # make a plot.
Usamos parallel_coordinates e passamos o conjunto de dados.
Na linha 3, podemos ver que o conjunto de dados é criado usando a função pandas.DataFrame ( ) . Em seguida, adicionamos Item, Variável A, Variável B e Variável C, que são refletidos em nossa lista de Valores .
Na linha 4, o conjunto de dados é desduplicado usando dataset.drop_duplicates ( ).
Podemos ir para o painel Visualizações para ver os Valores que adicionamos.
A remoção de qualquer um desses valores afetará nossos recursos visuais. Por exemplo, se removermos a Variável C, as coordenadas mudarão de acordo, mostrando-nos como funcionam os Valores .
Vamos trazer de volta nossa Variável C marcando a caixa ao lado dela em Dados no painel Campos .
Em seguida, passe a função parallel_coordinates que recebe alguns argumentos diferentes. No nosso caso, leva o conjunto de dados e o Item, que fornecerá o tipo e a dimensão do nosso conjunto de dados.
Se removermos Item de nossa função e executá-lo, o visual não funcionará.
Receberemos um erro de script Python dizendo que a função parallel_coordinates ( ) está faltando 1 argumento posicional necessário, que é a class_column.
Então, vamos adicionar Item de volta. Por ser posicional, não precisamos escrever as coordenadas de classe. Podemos executar o código uma vez feito.
Mostrando o enredo em Python
O próximo passo é mostrar o enredo, então na linha 16, documentamos o que vamos fazer escrevendo # show the plot.
Lembre-se de que importamos matplotlib.pyplot anteriormente e o salvamos como plt. Fizemos isso porque precisamos da função plt.show() para mostrar nosso gráfico.
Gráficos de coordenadas paralelas em Python: amostra 2
Nosso segundo gráfico é um conjunto de dados de íris mostrando petal_length, petal_width, sepal_length e sepal_width. Tem um pouco mais de estilo em comparação com o primeiro gráfico.
Este conjunto de dados foi criado com código Python.
Para visualizar nossos dados, clique em Transform data e vá para o iris_dataset.
O conjunto de dados contém colunas para as dimensões — comprimento da sépala , largura da sépala , comprimento da pétala e largura da pétala . Também possui uma coluna para o tipo de espécie .
O código Python do conjunto de dados
Nossos dados foram trazidos facilmente usando o código Python. Vá para Source para mostrar o script Python.
Nosso código Python tem apenas duas linhas. Na primeira linha, importamos seaborn e salvamos como variável sns . Nomeamos nosso conjunto de dados como iris_dataset e usamos a variável sns para carregar o conjunto de dados usando a função sns.load_dataset('iris') .
Clique em OK para obter os dados que vimos acima. Navegue pelos dados e, uma vez concluído, podemos fechar o conjunto de dados acessando Fechar e aplicar > Fechar .
Estilizando Gráficos em Python
Para abrir o editor de script Python para nosso gráfico mais estilizado, clique em nosso segundo gráfico.
Começamos importando matplotlib.pyplot como plt.
Em seguida, usamos a função plt.style.use ('dark_background') para estilizar o visual.
Podemos personalizar facilmente o plano de fundo com base em nosso estilo preferido usando a referência de folha de estilo do matplotlib . No nosso caso, usamos um fundo escuro.
Vamos também tentar usar ggplot , que é um estilo comum usado.
Se o executarmos, ele nos dará um visual parecido com este.
Em seguida, carregue a função pandas para o gráfico importando parallel_coordinates de pandas.plotting.
Para fazer o gráfico, trazemos o conjunto de dados e definimos nossa espécie como a classe .
Comparado ao nosso primeiro gráfico, adicionamos um parâmetro adicional que é o mapa de cores para obter cores diferentes. Passe isso usando a variável matplotlib, plt.get_cmap.
Há muitas variáveis de cores do matplotlib para escolher na referência do mapa de cores do matplotlib .
Por exemplo, atualmente estamos usando o Conjunto 2 de mapas de cores qualitativos, mas também podemos alterá-lo para outras cores, como hsv de mapas de cores cíclicos.
Clique em executar para obter um gráfico parecido com este.
Hsv não parece muito bom em nossos dados, mas podemos brincar até encontrar o mapa de cores mais adequado para nosso gráfico.
Correlação Python: Guia para criar
conjuntos de dados visuais em pandas com ProfileReport() | Python no LuckyTemplates
Função Seaborn em Python para visualizar a distribuição de uma variável
Conclusão
Neste tutorial, abordamos os fundamentos da criação de plotagens de coordenadas paralelas em Python. Passamos pelo processo de preparação dos dados, criação do gráfico e personalização do gráfico para melhor legibilidade.
Os gráficos de coordenadas paralelas são uma ferramenta poderosa para visualizar dados de alta dimensão e podem ser usados em vários campos, incluindo finanças, engenharia e aprendizado de máquina. Agora que sabemos como criar gráficos de coordenadas paralelas em Python , podemos começar a usá-los para entender e visualizar melhor nossos próprios dados.
Tudo de bom,
gaelim holanda
Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.
Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates
Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.
Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.
Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.
Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.
Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.
O que é self em Python: exemplos do mundo real
Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.
Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.