Conjunto de dados Python: aplicando códigos repetíveis

Neste blog, você aprenderá como aplicar códigos ou funções repetíveis a conjuntos de dados do Python para produzir o mesmo tipo de saída. Isso ajudará você a ser mais eficiente e a se esforçar menos para extrair determinados dados de diferentes conjuntos de dados. Neste tutorial, vamos utilizar um código existente que criei anteriormente como exemplo.

Você também aprenderá como fazer cópias de conjuntos de dados para evitar danificar a versão original do conjunto de dados, importar bibliotecas e funções usando códigos repetíveis e criar uma visualização no LuckyTemplates .

Para este blog, recomendo que você obtenha o arquivo CSV o tempo todo e o leve para o LuckyTemplates. Também demonstrarei como podemos trazer esse arquivo CSV e colocá-lo diretamente no LuckyTemplates, caso seja necessário.

Índice

Buscando um arquivo CSV no LuckyTemplates

Para trazer um arquivo CSV para o LuckyTemplates, a primeira coisa que você precisa fazer é clicar no menu “ Obter dados ” na faixa de opções Home .

Conjunto de dados Python: aplicando códigos repetíveis

Depois de clicar, um menu suspenso aparecerá e você deverá selecionar a opção “ Texto/CSV ” no menu.

Conjunto de dados Python: aplicando códigos repetíveis

Depois de selecionar a opção “ Texto/CSV ”, abrirá uma janela onde podemos selecionar o arquivo que queremos trazer para o LuckyTemplates. Para este exemplo, vamos usar o arquivo IMDB Dataset

Conjunto de dados Python: aplicando códigos repetíveis

Ao abrir o arquivo IMDB Dataset.csv , você verá outra janela que exibe os dados contidos nesse arquivo. Como esse arquivo contém uma grande quantidade de dados, ele apenas visualiza alguns dos dados.

A primeira coisa que vamos fazer neste arquivo é transformá-lo. Para isso, basta clicar na opção “ Transform Data ” na parte inferior direita da janela.

Conjunto de dados Python: aplicando códigos repetíveis

Fazendo uma cópia do conjunto de dados do Python

Antes de fazer qualquer alteração neste conjunto de dados, é importante fazer uma cópia do conjunto de dados original. Para fazer isso, basta clicar com o botão direito do mouse no conjunto de dados. 

Conjunto de dados Python: aplicando códigos repetíveis

Em seguida, no menu, selecione “ Copiar ”.

Conjunto de dados Python: aplicando códigos repetíveis

Por fim, clique com o botão direito do mouse no painel Consultas e selecione “ Colar ” nas opções.

Conjunto de dados Python: aplicando códigos repetíveis

Depois de aplicar essas etapas, você deve ter uma cópia do conjunto de dados IMDB original no painel Consultas .

Conjunto de dados Python: aplicando códigos repetíveis

Transformando um conjunto de dados executando um script Python

Ao transformar um arquivo CSV, você poderá dividir grandes quantidades de conjuntos de dados do Python em conjuntos menores. Podemos fazer isso aplicando algum script Python neste arquivo.

Mas primeiro, temos que ter certeza de que os cabeçalhos estão alinhados corretamente. Clique no menu Home , procure a opção “ Use First Row as Headers ” e clique nela.

Conjunto de dados Python: aplicando códigos repetíveis

Depois de clicar na opção " Usar primeira linha como cabeçalhos ", os cabeçalhos agora são alterados para os dados das primeiras linhas anteriores, que são " revisão " e " sentimento ".

Conjunto de dados Python: aplicando códigos repetíveis

Em seguida, vá ao menu Transform e clique na opção “ Run Python Script no grupo de opções “ Scripts ”.

Conjunto de dados Python: aplicando códigos repetíveis

Depois disso, uma janela “ Run Python Script ” aparecerá. Nesta janela, você pode executar qualquer script Python que desejar para transformar o arquivo atual que está usando. Para este exemplo, vou diminuir o conjunto de dados executando o código a seguir.

Conjunto de dados Python: aplicando códigos repetíveis

Usei a função .iloc no conjunto de dados para selecionar as linhas e colunas específicas do conjunto de dados do IMDB. Em seguida, nos parâmetros, selecionei todas as primeiras 500 linhas e todas as colunas do IMDB Dataset. Eu armazenei em uma variável chamada “ dataset ”.

Após executar o script, devemos ver o “dataset” que é a variável que criamos no passo anterior. Ele contém os dados que alteramos usando o script Python.

Conjunto de dados Python: aplicando códigos repetíveis

Verificando o conjunto de dados

Para abrir a tabela do conjunto de dados , basta clicar em “ Tabela na coluna Valor .

Conjunto de dados Python: aplicando códigos repetíveis

Podemos ver que esse conjunto de dados agora está reduzido a 500 linhas .

Conjunto de dados Python: aplicando códigos repetíveis

Agora que dividimos nosso conjunto de dados Python em 500 linhas, a próxima coisa que faremos é importar as bibliotecas de que precisamos. Faremos isso usando o mesmo procedimento que fizemos ao alterar o conteúdo do IMDB Dataset. Isso é para garantir que nosso código possa ser gerenciado em determinados cenários com menos alterações.

Importando bibliotecas e funções usando códigos repetíveis

Para importar as bibliotecas, vamos voltar ao nosso notebook e copiar as bibliotecas que precisamos. Lembre-se de que, antes deste tutorial, já criei essas bibliotecas que estamos prestes a copiar. Estou apenas reutilizando-os para que você tenha uma ideia clara sobre o uso de funções como códigos repetíveis.

Conjunto de dados Python: aplicando códigos repetíveis

Depois que as bibliotecas forem copiadas, cole-as na janela “ Run Python Script ” e não se esqueça de incluir a linha “ from collections import Counter ” no final do script. 

Conjunto de dados Python: aplicando códigos repetíveis

Em seguida, copiaremos a função de limpeza de dados de nosso notebook e a adicionaremos ao script Python no LuckyTemplates.

Conjunto de dados Python: aplicando códigos repetíveis

Vamos adicioná-lo abaixo das bibliotecas. 

Conjunto de dados Python: aplicando códigos repetíveis

Também copiaremos o código para chamar a função que acabamos de adicionar.

Conjunto de dados Python: aplicando códigos repetíveis

Em seguida, cole-o no script Python no LuckyTemplates.

Conjunto de dados Python: aplicando códigos repetíveis

Gerando Tabelas de Dados

Agora que adicionamos o código para chamar a função de limpeza de dados , precisamos alterar “ df2 ” para “ dataset ” e “ title ” para “ review ”. Fizemos isso devido às alterações que fizemos no conjunto de dados.

Mudamos “df2” para “ dataset ” porque armazenamos os dados com 500 linhas em “dataset”. Em seguida, para “título”, atualizamos para “revisão” como resultado da alteração dos cabeçalhos das colunas.

Com esses códigos adicionados, devemos ser capazes de obter ou gerar 3 tabelas que são data1 para frequência de palavra, data2 para frequência de bigrama e data3 para frequência de trigrama.

Conjunto de dados Python: aplicando códigos repetíveis

Você também pode fazer outra cópia deste conjunto de dados IMDB alterado (2) para abrir outra tabela mais tarde.

Conjunto de dados Python: aplicando códigos repetíveis

Agora no IMDB Dataset (2) , vamos abrir a tabela data1

Conjunto de dados Python: aplicando códigos repetíveis

 Uma vez que a tabela data1 é aberta, podemos ver a lista de palavras, bem como a frequência.

Conjunto de dados Python: aplicando códigos repetíveis

Como você pode ver, podemos executar determinados procedimentos do conjunto de dados principal com o uso de códigos repetíveis que extraímos do Jupyter Notebook. Com esses códigos repetíveis, podemos transformar um conjunto de dados Python e gerar uma tabela para frequência de palavra, frequência de bigrama e frequência de trigrama sem digitar os códigos novamente.

No IMDB Dataset (3) , vamos abrir a tabela data2 para ver a frequência bigrama.

Conjunto de dados Python: aplicando códigos repetíveis

Na tabela de frequência bigrama, você pode ver o “ br ” incluído na lista. Isso provavelmente está conectado a um código HTML. Podemos simplesmente voltar e adicionar outra coisa, mas não faremos isso neste tutorial.

Agora que os dados foram carregados com a ajuda dos códigos repetíveis, podemos começar a fazer visualizações sobre eles no LuckyTemplates. Por exemplo, um gráfico de barras para a frequência de cada palavra. 

Conjunto de dados Python: aplicando códigos repetíveis


funções definidas pelo usuário do Python | Uma Visão Geral
Lista Python e For Loops no LuckyTemplates
Usando Python no LuckyTemplates | Conjunto de dados e função de string

Conclusão

Para resumir, os códigos repetíveis podem ajudá-lo a executar determinados procedimentos em um conjunto de dados com menos esforço. Você aprendeu a utilizar códigos repetíveis para transformar um conjunto de dados Python no LuckyTemplates. Você também pode usar a função .iloc para especificar as linhas e colunas a serem selecionadas na alteração de um conjunto de dados.

Além disso, você criou cópias de conjuntos de dados e criou uma visualização usando um gráfico de barras. Essa visualização é baseada nos conjuntos de dados do Python que criamos e alteramos com a ajuda de códigos repetíveis.

Tudo de bom,

gaellim

Leave a Comment

Colunas calculadas no SharePoint | Uma visão geral

Colunas calculadas no SharePoint | Uma visão geral

Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.

Atributos pré-atentivos: como isso pode afetar seu relatório

Atributos pré-atentivos: como isso pode afetar seu relatório

Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Calcular Dias de Estoque Zero – LuckyTemplates Inventory Management Insights

Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Usando exibições de gerenciamento dinâmico (DMV) no DAX Studio

Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.

Variáveis ​​e expressões dentro do editor do Power Query

Variáveis ​​e expressões dentro do editor do Power Query

Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Como calcular a diferença em dias entre compras usando o DAX no LuckyTemplates

Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calculando a média no LuckyTemplates: isolando os resultados do dia da semana ou do fim de semana usando o DAX

Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

O que é self em Python: exemplos do mundo real

Como salvar e carregar um arquivo RDS em R

Como salvar e carregar um arquivo RDS em R

Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Primeiros N dias úteis revisitados - uma solução de linguagem de codificação DAX

Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.