Colunas calculadas no SharePoint | Uma visão geral
Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.
A otimização do código R pode melhorar significativamente o desempenho de scripts e programas R, tornando-os executados com mais eficiência. Isso é especialmente importante para conjuntos de dados grandes e complexos, bem como para aplicativos que precisam ser executados em tempo real ou regularmente.
Neste tutorial , avaliaremos e otimizaremos o desempenho de um código R usando diferentes pacotes do R , como o aimverse e o data.table. Como exemplo, veremos quanto tempo leva para o RStudio ler um arquivo CSV grande usando a função read.csv ( ) , o pacote alignverse e o pacote data.table.
Índice
Otimizando o desempenho em R
Abra o RStudio. No script R, atribua a extensão do arquivo a uma variável.
Você precisa usar a função system.file ( ) para determinar quanto tempo leva para executar uma função ou operação. Como queremos avaliar quanto tempo leva para abrir um arquivo, escreva read.csv (df) no argumento.
Ao executar o código, o Console mostrará o tempo que levou para abrir o arquivo. A coluna decorrido mostra quanto tempo levou para a CPU executar o código R. Os resultados mostram que o RStudio levou 31,93 segundos, o que é um tempo significativo. Esse tempo de carregamento é impraticável se você estiver sempre trabalhando com grandes conjuntos de dados.
Uma das maneiras de otimizar o desempenho do seu código R é usando o pacote alignverse . Isso reduz o tempo de 30 para 5 segundos.
Observe que para ler o arquivo, você precisa usar a função read_csv ( ) .
O pacote aimverse melhora o tempo de carregamento em R por meio do uso do pacote readr , que fornece um conjunto de funções rápidas e eficientes para leitura e gravação de dados. O pacote readr fornece funções como read_csv ( ) e read_table ( ) que podem ler grandes conjuntos de dados de forma rápida e eficiente.
Outro método de otimização em R é usar o pacote data.table . Este é gratuito para download na internet.
O pacote data.table em R é uma ferramenta poderosa e eficiente para trabalhar com conjuntos de dados grandes e complexos. Ele fornece uma versão aprimorada do objeto data.frame, que é uma estrutura de dados central em R. A principal vantagem de data.table é seu alto desempenho e baixo uso de memória ao trabalhar com grandes conjuntos de dados.
Observe que ao usar este pacote, você precisa escrever a função fread ( ) em vez de read.csv ( ). Quando você executa isso junto com seu código, pode ver que o tempo de carregamento é reduzido para 2,25 segundos.
Comparando pacotes R usando o Microbenchmark
Para comparar o desempenho entre cada método, você pode usar a função microbenchmark ( ) .
A função microbenchmark ( ) em R é uma ferramenta para medir o desempenho do código R. Ele fornece uma interface simples e fácil de usar para comparar o tempo de execução de expressões R.
Uma grande coisa sobre esta função é que você pode definir quantas vezes o processo é repetido. Isso dá resultados mais precisos. Você também é capaz de identificar se os resultados são consistentes.
Se estiver com problemas para ler um arquivo CSV no LuckyTemplates, o RStudio pode fazer isso por você. Existem outras opções em R que você pode usar para otimizar o desempenho do seu código. Mas data.table é altamente recomendado por causa de sua simplicidade.
Conclusão
A otimização do código R é uma etapa importante para garantir que seus scripts R sejam executados com eficiência. Existem várias técnicas e ferramentas que podem ser usadas para otimizar o código R, como usar o pacote alignverse para manipulação de dados, usar o pacote data.table para grandes conjuntos de dados e usar o pacote microbenchmark para medir o desempenho do código R.
Também é importante ter em mente boas práticas de codificação, como usar operações vetorizadas em vez de loops, fazer uso de funções internas em vez de escrever suas próprias e estar atento ao uso de memória de seu código.
Tudo de bom,
Jorge Monte
Descubra a importância das colunas calculadas no SharePoint e como elas podem realizar cálculos automáticos e obtenção de dados em suas listas.
Descubra todos os atributos pré-atentivos e saiba como isso pode impactar significativamente seu relatório do LuckyTemplates
Aprenda a contar o número total de dias em que você não tinha estoque por meio dessa técnica eficaz de gerenciamento de inventário do LuckyTemplates.
Saiba mais sobre as exibições de gerenciamento dinâmico (DMV) no DAX Studio e como usá-las para carregar conjuntos de dados diretamente no LuckyTemplates.
Este tutorial irá discutir sobre Variáveis e Expressões dentro do Editor do Power Query, destacando a importância de variáveis M e sua sintaxe.
Aprenda a calcular a diferença em dias entre compras usando DAX no LuckyTemplates com este guia completo.
Calcular uma média no LuckyTemplates envolve técnicas DAX para obter dados precisos em relatórios de negócios.
O que é self em Python: exemplos do mundo real
Você aprenderá como salvar e carregar objetos de um arquivo .rds no R. Este blog também abordará como importar objetos do R para o LuckyTemplates.
Neste tutorial de linguagem de codificação DAX, aprenda como usar a função GENERATE e como alterar um título de medida dinamicamente.