Home
» Power BI
»
Power Query Modulo: Cómo manejar datos apilados
Power Query Modulo: Cómo manejar datos apilados
En este tutorial, voy a demostrar cómo puede transformar datos desordenados apilados en un formato más organizado. Hay una manera bastante fácil de hacer esto, y va a ser increíblemente útil y tiene muchas aplicaciones diferentes. Vamos a utilizar el módulo Power Query. Puedes ver el video completo de este tutorial en la parte inferior de este blog.
Mi esposa bajó a la oficina y dijo que había copiado un montón de direcciones de una invitación de calendario y terminó pegándolas en este formato. Tenía 28 direcciones de correo electrónico y nombres que terminaron en este tipo de formato extraño y apilado. Era una lista de nombres con un montón de comillas, comas, basura y direcciones de correo electrónico. Quería saber cómo usar Power Query para obtener un mejor formato.
Entonces, saltemos a Power Query y veremos los datos sin procesar. Mantengamos los datos sin procesar intactos y solo hagamos referencia a ellos. Llamaremos a este archivo de referencia, TestData .
Lo primero que vamos a hacer es agregar un índice y realmente no importa para estos fines si se trata de un índice de base cero o de uno. Solo usaremos un índice basado en cero para esta demostración. Es fácil hacer clic sin tener que pasar por ninguna otra opción.
Esto implicará un pivote porque un pivote toma filas y las convierte en columnas. En este caso, queremos tomar este conjunto de filas y convertirlas en tres columnas: una para el nombre, otra para el apellido y otra para la dirección de correo electrónico.
Vamos a pivotearlos en las columnas, pero necesitamos tener una forma para que el pivote sepa qué elemento va en qué columna. Aquí es donde entra en juego Power Query Modulo.
Manejo de datos apilados mediante Power Query Modulo
Modulo nos da el resto cuando dividimos un número en particular. Para acceder a Modulo, vamos a la pestaña Agregar columna, luego buscamos Estándar, hacemos clic en la flecha desplegable y nos desplazamos hacia abajo.
Cuando hacemos clic en Modulo, nos da un cuadro emergente que solicita la cantidad de columnas que queremos. En este caso, queremos tres columnas.
Si dividimos tres por tres, obtenemos uno con resto cero. Tres entre cuatro da un resto de uno, tres entre cinco da un resto de dos, y luego tres entre seis nos da un resto de cero. Entonces, produce este lindo patrón repetitivo que podemos usar para nuestro pivote.
Pero antes de hacer eso, limpie los datos. Hay dos maneras en que podemos hacer esto. Una es que podemos simplemente reemplazar valores. Por ejemplo, para las comillas, podemos simplemente poner la cita allí y luego reemplazarla con nada. Tomará y limpiará esas comillas.
La otra forma de hacer esto donde podemos limpiarlo todo a la vez y ahorrar algunos pasos es usando una función llamada Text.Remove . Primero, agregamos una columna personalizada y luego enumeramos todos los valores de los que queremos deshacernos.
Como puede ver, eso aclara todo muy bien y fácilmente. Entonces, ahora podemos deshacernos de esa columna inicial y luego mover esa columna personalizada.
Ahora podemos hacer nuestro pivote limpiamente. Tomamos Modulo, vamos a Transformar y luego a Pivotar columna, y vamos a pivotar en Personalizado, pero no queremos que se agregue. Entonces, elegiremos No agregar y haremos clic en Aceptar.
Simplemente lo estamos reemplazando con estos valores en la columna. Luego crea esas tres columnas para nosotros. Podemos ver el apellido, el nombre y la dirección de correo electrónico allí, pero no es exactamente el formato que queremos.
Para arreglar eso, podemos tomar estas columnas y luego hacer un Fill Up .
Y ahora tenemos estas filas adicionales debido al patrón repetitivo del Modulo.
Podemos deshacernos fácilmente de eso eliminando filas alternas. Podemos hacerlo en la opción Eliminar filas.
Podemos decir que la primera fila a eliminar es dos. Luego quite la segunda y la tercera fila, y luego mantenga la cuarta y hágalo como un patrón repetitivo.
Ahora puede ver que hemos limpiado todos los datos correctos de una manera agradable y todavía tenemos las 28 direcciones de correo electrónico originales.
Ahora podemos deshacernos de la columna Índice y cambiar el nombre de los encabezados de columna en consecuencia.
Puede ver que con solo el truco de Modulo, y luego girando los datos y con un poco de limpieza, es bastante fácil de hacer. Una vez que te acostumbres, probablemente solo te tome alrededor de un minuto hacerlo todo.
Entonces, con suerte, esto le ha dado algunas ideas y herramientas más. También puedes ver mi próximo tutorial . En eso, analizaremos más a fondo algunas de las cosas que cubrimos en este tutorial y también veremos cómo podemos automatizar este proceso de manera repetible, utilizando funciones personalizadas. También le mostraré algunos trucos geniales para depurar sus funciones personalizadas.
Espero que hayas encontrado eso útil. Puede ver el video completo a continuación y consultar los enlaces a continuación para obtener más contenido relacionado.