Módulo Power Query: como lidar com dados empilhados

Neste tutorial, vou demonstrar como você pode transformar dados empilhados confusos em um formato mais organizado. Existe uma maneira bem fácil de fazer isso, que será incrivelmente útil e terá muitos aplicativos diferentes. Vamos usar o módulo Power Query. Você pode assistir ao vídeo completo deste tutorial na parte inferior deste blog.

Minha esposa desceu ao escritório e disse que copiou um monte de endereços de um convite de calendário e acabou colando neste formato. Ela tinha 28 endereços de e-mail e nomes que acabaram nesse tipo de formato esquisito e empilhado. Era uma lista de nomes com um monte de aspas, vírgulas, lixo eletrônico e endereços de e-mail. Ela queria saber como usar o Power Query para obter um formato melhor.

Módulo Power Query: como lidar com dados empilhados

Então, vamos pular para o Power Query e veremos os dados brutos. Vamos manter os dados brutos intactos e apenas fazer referência a eles. Chamaremos esse arquivo de referência de TestData .

Módulo Power Query: como lidar com dados empilhados

A primeira coisa que vamos fazer é adicionar um índice e realmente não importa para esses propósitos se é um índice baseado em zero ou um índice baseado em um. Usaremos apenas um índice baseado em zero para esta demonstração. É fácil clicar sem ter que passar por nenhuma outra opção.

Módulo Power Query: como lidar com dados empilhados

Isso envolverá um pivô porque um pivô pega linhas e as transforma em colunas. Nesse caso, queremos pegar esse conjunto de linhas e transformá-las em três colunas – uma para o primeiro nome, uma para o sobrenome e outra para o endereço de e-mail.

Vamos dinamizá-los nas colunas, mas precisamos ter uma maneira de o pivô saber qual elemento entra em qual coluna. É aqui que entra o módulo Power Query.

Índice

Manipulando dados empilhados usando o módulo Power Query

Módulo nos dá o resto quando dividimos um determinado número. Para acessar o Módulo, vamos até a guia Adicionar Coluna, depois encontraremos Padrão, clique na seta suspensa e role para baixo.

Módulo Power Query: como lidar com dados empilhados

Quando clicamos no Módulo, ele nos dá uma caixa pop-up que pede o número de colunas que queremos. Neste caso, queremos três colunas.

Módulo Power Query: como lidar com dados empilhados

Se dividirmos três por três, obtemos um com resto zero. Três sobre quatro dá um resto de um, três sobre cinco dá um resto de dois e então três sobre seis nos dá um resto de zero. Então, ele produz esse belo padrão de repetição que podemos usar para nosso pivô.

Mas antes de fazermos isso, vamos limpar os dados. Há duas maneiras de fazer isso. Uma delas é que podemos simplesmente substituir valores. Por exemplo, para as aspas, podemos apenas colocar a citação lá e substituí-la por nada. Ele vai tirar e limpar essas citações.

Módulo Power Query: como lidar com dados empilhados

A outra maneira de fazer isso, onde podemos limpá-lo de uma só vez e salvar algumas etapas, é usando uma função chamada Text.Remove . Primeiro, adicionamos uma coluna personalizada e, em seguida, listamos todos os valores dos quais queremos nos livrar.

Módulo Power Query: como lidar com dados empilhados

Como você pode ver, isso limpa tudo de maneira agradável e fácil. E assim, agora podemos nos livrar dessa coluna inicial e, em seguida, mover essa coluna personalizada.

Módulo Power Query: como lidar com dados empilhados

Agora podemos fazer nosso pivô de forma limpa. Assumimos o Módulo, vamos para Transformar e, em seguida, Pivot Column, e vamos girar no Custom, mas não queremos que ele agregue. Então, vamos escolher Don't Aggregate e clicar em OK.

Módulo Power Query: como lidar com dados empilhados

Estamos apenas substituindo-o por esses valores na coluna. Em seguida, cria essas três colunas para nós. Podemos ver o sobrenome, o nome e o endereço de e-mail, mas não é exatamente o formato que queremos.

Para corrigir isso, podemos pegar essas colunas e, em seguida, fazer um Preenchimento .

Módulo Power Query: como lidar com dados empilhados

E agora temos essas linhas extras por causa do padrão de repetição do Módulo.

Módulo Power Query: como lidar com dados empilhados

Podemos facilmente nos livrar disso removendo linhas alternativas. Podemos fazer isso na opção Remove Rows.

Módulo Power Query: como lidar com dados empilhados

Podemos dizer que a primeira linha a ser removida é duas. Em seguida, remova a segunda e a terceira linha e, em seguida, mantenha a quarta e faça isso como um padrão de repetição.

Módulo Power Query: como lidar com dados empilhados

Agora você pode ver que limpamos todos os dados corretos de uma maneira agradável e ainda temos os 28 endereços de e-mail originais.

Módulo Power Query: como lidar com dados empilhados

Agora podemos nos livrar da coluna Index e renomear os cabeçalhos da coluna de acordo.


Módulo do LuckyTemplates e funções DAX de divisão inteira
Práticas recomendadas do Power Query para seu modelo de dados
Power Query M: padrão 0-1 alternado na tabela de datas

Conclusão

Você pode ver isso apenas com o truque do Módulo e, em seguida, girando os dados e com um pouco de limpeza, é muito fácil de fazer. Depois de pegar o jeito, provavelmente leva apenas cerca de um minuto para fazer a coisa toda.

Espero que isso tenha lhe dado mais algumas ideias e ferramentas. Você também pode conferir meu próximo tutorial . Com isso, vamos dar uma olhada em algumas das coisas que abordamos neste tutorial e também em como podemos automatizar esse processo de maneira repetível, usando funções personalizadas. Também mostrarei alguns truques interessantes para depurar suas funções personalizadas.

Espero que você tenha achado isso útil. Você pode assistir ao vídeo completo abaixo e conferir os links abaixo para mais conteúdo relacionado.

Tudo de bom!

Leave a Comment

Colunas calculadas no SharePoint | Uma visão geral

Colunas calculadas no SharePoint | Uma visão geral

Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.

Atributos pré-atentivos: como isso pode afetar seu relatório

Atributos pré-atentivos: como isso pode afetar seu relatório

Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.

Variáveis ​​e expressões dentro do editor do Power Query

Variáveis ​​e expressões dentro do editor do Power Query

Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

Como salvar e carregar um arquivo RDS em R

Como salvar e carregar um arquivo RDS em R

Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.