Power Query Modulo: omgaan met gestapelde gegevens

Power Query Modulo: omgaan met gestapelde gegevens

In deze zelfstudie laat ik zien hoe u rommelige gestapelde gegevens kunt omzetten in een meer georganiseerd formaat. Er is een vrij gemakkelijke manier om dit te doen, en het is er een die ongelooflijk nuttig zal zijn en veel verschillende toepassingen heeft. We gaan de Power Query-modulo gebruiken. Je kunt de volledige video van deze tutorial onderaan deze blog bekijken.

Mijn vrouw kwam het kantoor binnen en zei dat ze een aantal adressen uit een agenda-uitnodiging had gekopieerd en dat het uiteindelijk in dit formaat was geplakt. Ze had 28 e-mailadressen en namen die in dit soort rare, gestapelde indeling terechtkwamen. Het was een lijst met namen met een heleboel aanhalingstekens, komma's, junkmail en e-mailadressen. Ze wilde weten hoe ze Power Query kon gebruiken om dat in een betere indeling te krijgen.

Power Query Modulo: omgaan met gestapelde gegevens

Laten we dus naar Power Query springen en de onbewerkte gegevens bekijken. Laten we de onbewerkte gegevens intact houden en er gewoon naar verwijzen. We noemen dit referentiebestand TestData .

Power Query Modulo: omgaan met gestapelde gegevens

Het eerste dat we gaan doen, is een index toevoegen en het maakt voor deze doeleinden niet echt uit of het een op nul gebaseerde index of een op één gebaseerde index is. We gebruiken alleen een op nul gebaseerde index voor deze demonstratie. Het is gemakkelijk om te klikken zonder andere opties te hoeven doorlopen.

Power Query Modulo: omgaan met gestapelde gegevens

Dit gaat een spil inhouden omdat een spil rijen neemt en ze in kolommen verandert. In dit geval willen we deze reeks rijen nemen en er drie kolommen van maken: één voor de voornaam, één voor de achternaam en één voor het e-mailadres.

We gaan die in de kolommen laten draaien, maar we moeten een manier hebben waarop de spil weet welk element in welke kolom komt. Dit is waar Power Query Modulo om de hoek komt kijken.

Inhoudsopgave

Omgaan met gestapelde gegevens met behulp van Power Query Modulo

Modulo geeft ons de rest als we een bepaald getal delen. Om toegang te krijgen tot Modulo, gaan we naar het tabblad Kolom toevoegen, dan zoeken we Standaard, klikken op de vervolgkeuzepijl en scrollen naar beneden.

Power Query Modulo: omgaan met gestapelde gegevens

Wanneer we op Modulo klikken, krijgen we een pop-upvenster waarin wordt gevraagd naar het aantal kolommen dat we willen. In dit geval willen we drie kolommen.

Power Query Modulo: omgaan met gestapelde gegevens

Als we drie door drie delen, krijgen we één met een rest van nul. Drie in vier geeft een rest van één, drie in vijf geeft een rest van twee, en drie in zes geeft ons een rest van nul. Dus het produceert dit mooie herhalende patroon dat we kunnen gebruiken voor onze spil.

Maar voordat we dat doen, laten we de gegevens opschonen. Er zijn twee manieren waarop we dit kunnen doen. Een daarvan is dat we eenvoudig waarden kunnen vervangen. Voor de aanhalingstekens kunnen we bijvoorbeeld de aanhalingstekens erin plaatsen en dan vervangen door niets. Het zal die aanhalingstekens verwijderen en opschonen.

Power Query Modulo: omgaan met gestapelde gegevens

De andere manier om dit te doen, waarbij we het allemaal tegelijk kunnen opschonen en enkele stappen kunnen opslaan, is door een functie genaamd Text.Remove te gebruiken . Eerst voegen we een aangepaste kolom toe en vervolgens vermelden we alle waarden die we willen verwijderen.

Power Query Modulo: omgaan met gestapelde gegevens

Zoals je kunt zien, ruimt dat alles mooi en gemakkelijk op. En dus kunnen we nu die eerste kolom verwijderen en die aangepaste kolom verplaatsen.

Power Query Modulo: omgaan met gestapelde gegevens

We kunnen nu onze spil netjes doen. We nemen het op tegen de Modulo, gaan naar Transformeren en dan Pivot Column, en we gaan draaien op de Custom, maar we willen niet dat het aggregeert. We kiezen dus voor Niet aggregeren en klikken op OK.

Power Query Modulo: omgaan met gestapelde gegevens

We vervangen het gewoon door deze waarden in de kolom. Vervolgens worden die drie kolommen voor ons gemaakt. We kunnen de achternaam, voornaam en e-mailadres daarin zien, maar het is niet precies het formaat dat we willen.

Om dat op te lossen, kunnen we deze kolommen nemen en vervolgens een Fill Up doen .

Power Query Modulo: omgaan met gestapelde gegevens

En nu hebben we deze extra rijen vanwege het herhalende patroon van de Modulo.

Power Query Modulo: omgaan met gestapelde gegevens

We kunnen daar gemakkelijk vanaf komen door alternatieve rijen te verwijderen. We kunnen dat doen in de optie Rijen verwijderen.

Power Query Modulo: omgaan met gestapelde gegevens

We kunnen zeggen dat de eerste te verwijderen rij twee is. Verwijder vervolgens de tweede en derde rij, en houd dan de vierde en doe dat als een herhalend patroon.

Power Query Modulo: omgaan met gestapelde gegevens

U kunt nu zien dat we alle juiste gegevens op een mooie manier hebben opgeschoond en dat we nog steeds de 28 originele e-mailadressen hebben.

Power Query Modulo: omgaan met gestapelde gegevens

Nu kunnen we de kolom Index verwijderen en de kolomkoppen dienovereenkomstig hernoemen.


LuckyTemplates Modulo en Integer-Divide DAX-functies
Power Query Best Practices voor uw gegevensmodel
Power Query M: Afwisselend 0-1-patroon in datumtabel

Conclusie

Je kunt zien dat met alleen de Modulo-truc, en dan de gegevens draaien en met een beetje opschonen, het vrij eenvoudig is om te doen. Als je het eenmaal onder de knie hebt, duurt het waarschijnlijk maar een minuut om het hele ding te doen.

Dus hopelijk heeft dit je wat meer ideeën en tools opgeleverd. Je kunt ook mijn volgende tutorial bekijken . Daarin gaan we dieper in op enkele dingen die we in deze zelfstudie hebben behandeld en kijken we ook naar hoe we dit proces op een herhaalbare manier kunnen automatiseren, met behulp van aangepaste functies. Ik ga je enkele coole trucs laten zien voor het debuggen van je aangepaste functies.

Ik hoop dat je dat nuttig vond. U kunt de volledige video hieronder bekijken en de onderstaande links bekijken voor meer gerelateerde inhoud.

Al het beste!


Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Een RDS-bestand opslaan en laden in R

Een RDS-bestand opslaan en laden in R

Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.

First N Business Days Revisited – Een DAX-coderingstaaloplossing

First N Business Days Revisited – Een DAX-coderingstaaloplossing

In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.

Inleiding tot het filteren van context in LuckyTemplates

Inleiding tot het filteren van context in LuckyTemplates

In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.

Zakelijke rapportage met behulp van LuckyTemplates

Zakelijke rapportage met behulp van LuckyTemplates

Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten