Qué es uno mismo en Python: ejemplos del mundo real
Qué es uno mismo en Python: ejemplos del mundo real
En este tutorial, voy a demostrar cómo puede transformar datos desordenados apilados en un formato más organizado. Hay una manera bastante fácil de hacer esto, y va a ser increíblemente útil y tiene muchas aplicaciones diferentes. Vamos a utilizar el módulo Power Query. Puedes ver el video completo de este tutorial en la parte inferior de este blog.
Mi esposa bajó a la oficina y dijo que había copiado un montón de direcciones de una invitación de calendario y terminó pegándolas en este formato. Tenía 28 direcciones de correo electrónico y nombres que terminaron en este tipo de formato extraño y apilado. Era una lista de nombres con un montón de comillas, comas, basura y direcciones de correo electrónico. Quería saber cómo usar Power Query para obtener un mejor formato.
Entonces, saltemos a Power Query y veremos los datos sin procesar. Mantengamos los datos sin procesar intactos y solo hagamos referencia a ellos. Llamaremos a este archivo de referencia, TestData .
Lo primero que vamos a hacer es agregar un índice y realmente no importa para estos fines si se trata de un índice de base cero o de uno. Solo usaremos un índice basado en cero para esta demostración. Es fácil hacer clic sin tener que pasar por ninguna otra opción.
Esto implicará un pivote porque un pivote toma filas y las convierte en columnas. En este caso, queremos tomar este conjunto de filas y convertirlas en tres columnas: una para el nombre, otra para el apellido y otra para la dirección de correo electrónico.
Vamos a pivotearlos en las columnas, pero necesitamos tener una forma para que el pivote sepa qué elemento va en qué columna. Aquí es donde entra en juego Power Query Modulo.
Tabla de contenido
Manejo de datos apilados mediante Power Query Modulo
Modulo nos da el resto cuando dividimos un número en particular. Para acceder a Modulo, vamos a la pestaña Agregar columna, luego buscamos Estándar, hacemos clic en la flecha desplegable y nos desplazamos hacia abajo.
Cuando hacemos clic en Modulo, nos da un cuadro emergente que solicita la cantidad de columnas que queremos. En este caso, queremos tres columnas.
Si dividimos tres por tres, obtenemos uno con resto cero. Tres entre cuatro da un resto de uno, tres entre cinco da un resto de dos, y luego tres entre seis nos da un resto de cero. Entonces, produce este lindo patrón repetitivo que podemos usar para nuestro pivote.
Pero antes de hacer eso, limpie los datos. Hay dos maneras en que podemos hacer esto. Una es que podemos simplemente reemplazar valores. Por ejemplo, para las comillas, podemos simplemente poner la cita allí y luego reemplazarla con nada. Tomará y limpiará esas comillas.
La otra forma de hacer esto donde podemos limpiarlo todo a la vez y ahorrar algunos pasos es usando una función llamada Text.Remove . Primero, agregamos una columna personalizada y luego enumeramos todos los valores de los que queremos deshacernos.
Como puede ver, eso aclara todo muy bien y fácilmente. Entonces, ahora podemos deshacernos de esa columna inicial y luego mover esa columna personalizada.
Ahora podemos hacer nuestro pivote limpiamente. Tomamos Modulo, vamos a Transformar y luego a Pivotar columna, y vamos a pivotar en Personalizado, pero no queremos que se agregue. Entonces, elegiremos No agregar y haremos clic en Aceptar.
Simplemente lo estamos reemplazando con estos valores en la columna. Luego crea esas tres columnas para nosotros. Podemos ver el apellido, el nombre y la dirección de correo electrónico allí, pero no es exactamente el formato que queremos.
Para arreglar eso, podemos tomar estas columnas y luego hacer un Fill Up .
Y ahora tenemos estas filas adicionales debido al patrón repetitivo del Modulo.
Podemos deshacernos fácilmente de eso eliminando filas alternas. Podemos hacerlo en la opción Eliminar filas.
Podemos decir que la primera fila a eliminar es dos. Luego quite la segunda y la tercera fila, y luego mantenga la cuarta y hágalo como un patrón repetitivo.
Ahora puede ver que hemos limpiado todos los datos correctos de una manera agradable y todavía tenemos las 28 direcciones de correo electrónico originales.
Ahora podemos deshacernos de la columna Índice y cambiar el nombre de los encabezados de columna en consecuencia.
Módulo de LuckyTemplates y funciones DAX de división de enteros
Prácticas recomendadas de Power Query para su modelo de datos
Power Query M: patrón alternativo 0-1 en la tabla de fechas
Conclusión
Puede ver que con solo el truco de Modulo, y luego girando los datos y con un poco de limpieza, es bastante fácil de hacer. Una vez que te acostumbres, probablemente solo te tome alrededor de un minuto hacerlo todo.
Entonces, con suerte, esto le ha dado algunas ideas y herramientas más. También puedes ver mi próximo tutorial . En eso, analizaremos más a fondo algunas de las cosas que cubrimos en este tutorial y también veremos cómo podemos automatizar este proceso de manera repetible, utilizando funciones personalizadas. También le mostraré algunos trucos geniales para depurar sus funciones personalizadas.
Espero que hayas encontrado eso útil. Puede ver el video completo a continuación y consultar los enlaces a continuación para obtener más contenido relacionado.
¡Mis mejores deseos!
Qué es uno mismo en Python: ejemplos del mundo real
Aprenderá a guardar y cargar objetos desde un archivo .rds en R. Este blog también cubrirá cómo importar objetos desde R a LuckyTemplates.
En este tutorial del lenguaje de codificación DAX, aprenda a usar la función GENERAR y a cambiar dinámicamente el título de una medida.
Este tutorial cubrirá cómo usar la técnica de elementos visuales dinámicos de subprocesos múltiples para crear información a partir de visualizaciones de datos dinámicos en sus informes.
En este artículo, repasaré el contexto del filtro. El contexto del filtro es uno de los temas principales que cualquier usuario de LuckyTemplates debería conocer inicialmente.
Quiero mostrar cómo el servicio en línea de LuckyTemplates Apps puede ayudar a administrar diferentes informes e información generada a partir de varias fuentes.
Aprenda a calcular los cambios de su margen de beneficio utilizando técnicas como la bifurcación de medidas y la combinación de fórmulas DAX en LuckyTemplates.
Este tutorial analizará las ideas de materialización de cachés de datos y cómo afectan el rendimiento de DAX al proporcionar resultados.
Si todavía usa Excel hasta ahora, este es el mejor momento para comenzar a usar LuckyTemplates para sus necesidades de informes comerciales.
¿Qué es la puerta de enlace de LuckyTemplates? Todo lo que necesitas saber