Conjunto de datos de Python: aplicación de códigos repetibles

Conjunto de datos de Python: aplicación de códigos repetibles

En este blog, aprenderá a aplicar códigos o funciones repetibles a conjuntos de datos de Python para producir el mismo tipo de salida. Esto lo ayudará a ser más eficiente y esforzarse menos en obtener ciertos datos de diferentes conjuntos de datos. En este tutorial, vamos a utilizar un código existente que he creado previamente como ejemplo.

También aprenderá cómo hacer copias de conjuntos de datos para evitar dañar la versión original del conjunto de datos, importar bibliotecas y funciones usando códigos repetibles y crear una visualización en LuckyTemplates .

Para este blog, le recomiendo que obtenga el archivo CSV todo el tiempo y lo lleve a LuckyTemplates. También demostraré cómo podemos traer este archivo CSV y colocarlo directamente en LuckyTemplates, en caso de que tenga que hacerlo.

Tabla de contenido

Obtener un archivo CSV en LuckyTemplates

Para traer un archivo CSV a LuckyTemplates, lo primero que debe hacer es hacer clic en el menú " Obtener datos " en la cinta Inicio .

Conjunto de datos de Python: aplicación de códigos repetibles

Después de hacer clic, aparecerá un menú desplegable y deberá seleccionar la opción " Texto/CSV " del menú.

Conjunto de datos de Python: aplicación de códigos repetibles

Una vez selecciones la opción “ Texto/CSV ”, se abrirá una ventana donde podremos seleccionar el archivo que queremos traer a LuckyTemplates. Para este ejemplo, usemos el archivo de conjunto de datos de IMDB

Conjunto de datos de Python: aplicación de códigos repetibles

Al abrir el archivo IMDB Dataset.csv , verá otra ventana que muestra los datos dentro de ese archivo. Dado que este archivo contiene una gran cantidad de datos, solo muestra una vista previa de algunos de ellos.

Lo primero que vamos a hacer en este archivo es transformarlo. Para hacer eso, simplemente haga clic en la opción " Transformar datos " en la parte inferior derecha de la ventana.

Conjunto de datos de Python: aplicación de códigos repetibles

Hacer una copia del conjunto de datos de Python

Antes de realizar cambios en este conjunto de datos, es importante hacer una copia del conjunto de datos original. Para hacer esto, simplemente haga clic derecho en el conjunto de datos. 

Conjunto de datos de Python: aplicación de códigos repetibles

Luego, desde el menú, seleccione " Copiar ".

Conjunto de datos de Python: aplicación de códigos repetibles

Por último, haga clic derecho en el panel Consultas y luego seleccione " Pegar " de las opciones.

Conjunto de datos de Python: aplicación de códigos repetibles

Después de aplicar estos pasos, debería tener una copia del conjunto de datos IMDB original en el panel Consultas .

Conjunto de datos de Python: aplicación de códigos repetibles

Transformar un conjunto de datos mediante la ejecución de una secuencia de comandos de Python

Al transformar un archivo CSV, podrá dividir grandes cantidades de conjuntos de datos de Python en otros más pequeños. Podemos hacerlo aplicando algún script de Python en este archivo.

Pero primero, debemos asegurarnos de que los encabezados estén correctamente alineados. Haga clic en el menú Inicio , luego busque la opción " Usar la primera fila como encabezados " y haga clic en ella.

Conjunto de datos de Python: aplicación de códigos repetibles

Después de hacer clic en la opción " Usar la primera fila como encabezados ", los encabezados ahora cambiaron a los datos de las primeras filas anteriores, que son " revisión " y " sentimiento ".

Conjunto de datos de Python: aplicación de códigos repetibles

A continuación, vaya al menú Transformar y haga clic en la opción " Ejecutar script de Python " en el grupo de opciones " Scripts ".

Conjunto de datos de Python: aplicación de códigos repetibles

Después de eso, aparecerá una ventana " Ejecutar secuencia de comandos de Python ". En esta ventana, puede ejecutar cualquier secuencia de comandos de Python que desee para transformar el archivo actual que está utilizando. Para este ejemplo, voy a hacer que el conjunto de datos sea más pequeño ejecutando el siguiente código.

Conjunto de datos de Python: aplicación de códigos repetibles

Usé la función .iloc en el conjunto de datos para seleccionar las filas y columnas específicas del conjunto de datos de IMDB. Luego, en los parámetros, seleccioné las primeras 500 filas y todas las columnas en el conjunto de datos de IMDB. Lo almacené en una variable llamada " conjunto de datos ".

Después de ejecutar el script, deberíamos ver el "conjunto de datos", que es la variable que hemos creado en el paso anterior. Contiene los datos que hemos alterado usando el script de Python.

Conjunto de datos de Python: aplicación de códigos repetibles

Comprobación del conjunto de datos

Para abrir la tabla del conjunto de datos , simplemente haga clic en " Tabla " en la columna Valor .

Conjunto de datos de Python: aplicación de códigos repetibles

Podemos ver que este conjunto de datos ahora tiene 500 filas .

Conjunto de datos de Python: aplicación de códigos repetibles

Ahora que hemos dividido nuestro conjunto de datos de Python en 500 filas, lo siguiente que vamos a hacer es importar las bibliotecas que necesitamos. Lo haremos usando el mismo procedimiento que usamos para alterar el contenido de IMDB Dataset. Esto es para asegurarnos de que nuestro código pueda ser manejable en ciertos escenarios con menos alteraciones.

Importación de bibliotecas y funciones mediante códigos repetibles

Para importar las bibliotecas, regresemos a nuestro cuaderno y copiemos las bibliotecas que necesitamos. Tenga en cuenta que antes de este tutorial, ya había creado estas bibliotecas que estamos a punto de copiar. Solo estoy reutilizándolos para que tenga una idea clara sobre el uso de funciones como códigos repetibles.

Conjunto de datos de Python: aplicación de códigos repetibles

Una vez que haya copiado las bibliotecas, péguelas en la ventana " Ejecutar secuencia de comandos de Python " y no olvide incluir la línea " desde las colecciones importan el contador " al final de la secuencia de comandos. 

Conjunto de datos de Python: aplicación de códigos repetibles

Luego, copiaremos la función de limpieza de datos de nuestro cuaderno y la agregaremos al script de Python en LuckyTemplates.

Conjunto de datos de Python: aplicación de códigos repetibles

Lo agregaremos debajo de las bibliotecas. 

Conjunto de datos de Python: aplicación de códigos repetibles

También copiaremos el código para llamar a la función que acabamos de agregar.

Conjunto de datos de Python: aplicación de códigos repetibles

Luego péguelo en el script de Python en LuckyTemplates.

Conjunto de datos de Python: aplicación de códigos repetibles

Generación de tablas de datos

Ahora que hemos agregado el código para llamar a la función de limpieza de datos , debemos cambiar " df2 " por " conjunto de datos " y el " título " por " revisar ". Hicimos esto debido a los cambios que hicimos en el conjunto de datos.

Cambiamos "df2" a " conjunto de datos " porque almacenamos los datos con 500 filas en "conjunto de datos". Luego, para "título", lo actualizamos a "revisión" como resultado de cambiar los encabezados de las columnas.

Con estos códigos agregados, deberíamos poder obtener o generar 3 tablas que son datos1 para la frecuencia de palabras, datos2 para la frecuencia de bigramas y datos3 para la frecuencia de trigramas.

Conjunto de datos de Python: aplicación de códigos repetibles

También puede hacer otra copia de este conjunto de datos IMDB alterado (2) para abrir otra tabla más adelante.

Conjunto de datos de Python: aplicación de códigos repetibles

Ahora en IMDB Dataset (2) , abramos la tabla data1

Conjunto de datos de Python: aplicación de códigos repetibles

 Una vez que se abre la tabla data1 , podemos ver la lista de palabras, así como la frecuencia.

Conjunto de datos de Python: aplicación de códigos repetibles

Como puede ver, podemos realizar ciertos procedimientos desde el conjunto de datos principal con el uso de códigos repetibles que tomamos del Jupyter Notebook. Con esos códigos repetibles, podemos transformar un conjunto de datos de Python y generar una tabla para la frecuencia de palabras, la frecuencia de bigramas y la frecuencia de trigramas sin tener que volver a escribir los códigos .

En IMDB Dataset (3) , abramos la tabla data2 para ver la frecuencia del bigrama.

Conjunto de datos de Python: aplicación de códigos repetibles

En la tabla de frecuencias de bigramas, puede ver el “ br ” incluido en la lista. Esto probablemente esté conectado a un código HTML. Simplemente podemos regresar y agregar algo más, pero no lo haremos en este tutorial.

Ahora que los datos se han cargado con la ayuda de los códigos repetibles, podemos comenzar a realizar visualizaciones al respecto en LuckyTemplates. Por ejemplo, un gráfico de barras para la frecuencia de cada palabra. 

Conjunto de datos de Python: aplicación de códigos repetibles


Funciones definidas por el usuario de Python | Una
lista general de Python y bucles For en LuckyTemplates
con Python en LuckyTemplates | Conjunto de datos y función de cadena

Conclusión

En resumen, los códigos repetibles pueden ayudarlo a realizar ciertos procedimientos en un conjunto de datos con menos esfuerzo. Ha aprendido a utilizar códigos repetibles para transformar un conjunto de datos de Python en LuckyTemplates. También pudo usar la función .iloc para especificar las filas y columnas que se seleccionarán al modificar un conjunto de datos.

Además, creó copias de conjuntos de datos y creó una visualización mediante un gráfico de barras. Esta visualización se basa en los conjuntos de datos de Python que hemos creado y modificado con la ayuda de códigos repetibles.

Mis mejores deseos,

Gaellim


Qué es uno mismo en Python: ejemplos del mundo real

Qué es uno mismo en Python: ejemplos del mundo real

Qué es uno mismo en Python: ejemplos del mundo real

Cómo guardar y cargar un archivo RDS en R

Cómo guardar y cargar un archivo RDS en R

Aprenderá a guardar y cargar objetos desde un archivo .rds en R. Este blog también cubrirá cómo importar objetos desde R a LuckyTemplates.

Revisión de los primeros N días hábiles: una solución de lenguaje de codificación DAX

Revisión de los primeros N días hábiles: una solución de lenguaje de codificación DAX

En este tutorial del lenguaje de codificación DAX, aprenda a usar la función GENERAR y a cambiar dinámicamente el título de una medida.

Showcase Insights utilizando la técnica de elementos visuales dinámicos de subprocesos múltiples en LuckyTemplates

Showcase Insights utilizando la técnica de elementos visuales dinámicos de subprocesos múltiples en LuckyTemplates

Este tutorial cubrirá cómo usar la técnica de elementos visuales dinámicos de subprocesos múltiples para crear información a partir de visualizaciones de datos dinámicos en sus informes.

Introducción al contexto de filtro en LuckyTemplates

Introducción al contexto de filtro en LuckyTemplates

En este artículo, repasaré el contexto del filtro. El contexto del filtro es uno de los temas principales que cualquier usuario de LuckyTemplates debería conocer inicialmente.

Los mejores consejos para usar las aplicaciones en el servicio en línea de LuckyTemplates

Los mejores consejos para usar las aplicaciones en el servicio en línea de LuckyTemplates

Quiero mostrar cómo el servicio en línea de LuckyTemplates Apps puede ayudar a administrar diferentes informes e información generada a partir de varias fuentes.

Analice los cambios en el margen de beneficio a lo largo del tiempo: análisis con LuckyTemplates y DAX

Analice los cambios en el margen de beneficio a lo largo del tiempo: análisis con LuckyTemplates y DAX

Aprenda a calcular los cambios de su margen de beneficio utilizando técnicas como la bifurcación de medidas y la combinación de fórmulas DAX en LuckyTemplates.

Ideas de materialización para cachés de datos en DAX Studio

Ideas de materialización para cachés de datos en DAX Studio

Este tutorial analizará las ideas de materialización de cachés de datos y cómo afectan el rendimiento de DAX al proporcionar resultados.

Informes comerciales con LuckyTemplates

Informes comerciales con LuckyTemplates

Si todavía usa Excel hasta ahora, este es el mejor momento para comenzar a usar LuckyTemplates para sus necesidades de informes comerciales.

¿Qué es la puerta de enlace de LuckyTemplates? Todo lo que necesitas saber

¿Qué es la puerta de enlace de LuckyTemplates? Todo lo que necesitas saber

¿Qué es la puerta de enlace de LuckyTemplates? Todo lo que necesitas saber