Wat is zelf in Python: voorbeelden uit de echte wereld
Wat is zelf in Python: voorbeelden uit de echte wereld
In deze zelfstudie gaan we in op frequentietabellen in Excel en op proportietabellen. We zullen bekijken wat ze zijn en wanneer ze moeten worden gebruikt. Je kunt de volledige video van deze tutorial onderaan deze blog bekijken.
Categorische variabelen meten 'wat voor soort iets', of het nu de koopstaat van een klant, het land van herkomst of iets anders is. Om dit soort variabelen samen te vatten, kunnen we de frequenties van elk type tellen, waarbij we hoeveelheden in frequentietabellen vergelijken. Maar soms helpt het om deze waarden als percentages te vergelijken, en daar komen verhoudingstabellen om de hoek kijken. Ik zal je laten zien hoe je beide in Excel kunt doen met behulp van draaitabellen, samen met de voor- en nadelen van het vergelijken van ruwe hoeveelheden van categorieën versus hun proporties.
Inhoudsopgave
Proportie- en frequentietabellen gebruiken in Excel
Het eerste dat ik ga doen, is een indexkolom maken. Wat ik hier probeer te doen is, laten we zeggen, tellen hoeveel van deze huizen een oprit hebben of niet. En het ding met draaitabellen is dat ze de gegevens willen aggregeren. En we willen de gegevens niet aggregeren. We willen het aantal waarnemingen tellen.
Het andere dat ik ga doen, en dat is in dit geval niet nodig, maar ik geef er echt de voorkeur aan en sta erop dat mijn gegevens in Excel in een tabel worden bewaard. Dus ik ga op OK klikken.
We kunnen de tabel dan hernoemen. Laten we het Huisvesting noemen .
Nu ga ik een draaitabel invoegen. Ons databereik is huisvesting . Er is al één voordeel. Het is heel duidelijk wat onze brongegevens zijn, dus laten we het in een bestaand werkblad plaatsen.
Hoeveel woningen hebben een oprit? Nou, daar kunnen we achter komen. Ik ga " oprit " naar de rijen verplaatsen en dan mijn index naar waarden brengen. Ik ga naar de instellingen van het veld Values, en ik maak er een count van .
Wat we nu zien is dat van 546 woningen 77 geen oprit hebben en 469 wel. Dat zijn onze frequenties.
We kunnen de ja's niet noodzakelijkerwijs delen door de nee, maar we kunnen wel tellen of elk een ja of een nee is. Dan komen we uit op dit nummer. Dit wordt in Excel een eenrichtingsfrequentietabel genoemd omdat we de frequenties in één richting met één variabele tellen.
Laten we er nu een tweerichtingsfrequentietabel van maken.
Ik ga bijvoorbeeld airconditioning nemen en dit naar de Columns slepen. Je zou het naar de rijen kunnen slepen, maar het is gebruikelijker om je tweerichtingsfrequentietabel op deze manier te plaatsen, waarbij we een van de variabelen in de kolommen hebben en een andere in de rijen.
Als je erover nadenkt, zien we nog steeds de 77 en de 469, behalve dat we het hebben gesplitst met de airconditioning van de huizen, nee of ja. Dus we kunnen zeggen dat van de 546 huizen, we er 158 hebben die wel airconditioning en een oprit hebben, 62 van hen hebben geen van beide, en dan ofwel of voor die andere waarden.
Dit wordt een tweewegfrequentietabel genoemd, ook wel contingentietabel genoemd.
We hebben 546 huizen, maar het is moeilijk om precies te weten hoeveel procent van de waarden in elk van deze emmers zit, toch? Tenzij je echt goed bent in hoofdrekenen, kan het moeilijk zijn om 62 heel snel in 546 te delen en te begrijpen welk percentage van elk in deze emmers zit.
Dus ik klik op Count of Index , ga naar Show Values As en dan maak ik hier een % van Grand Total van .
Door dit te doen, hebben we die ruwe waarden omgezet in percentages. Deze cijfers zijn in sommige opzichten gemakkelijker voor ons om te begrijpen. Dit is een meer intuïtieve manier voor ons om naar de gegevens te kijken.
Misschien willen we weten welk percentage van de records geen oprit heeft, en welk percentage van hen in de nee en in de ja's staat voor airconditioning. Dan kunnen we onze waarden veranderen. We zouden daar een rijtotaal van maken .
Dus we snijden elk van deze rijen door, om erachter te komen welk percentage in elk van die rijen zit.
Een ding dat moeilijk is met deze percentages, is dat we de gegevens kunstmatig hebben verkleind. We weten niet 2,7, 5% van wat dat belangrijk zou zijn om te weten. Als het heel klein is, als het 2,7, 5% van 120 waarnemingen is, dan is dat een klein aantal, toch? Als het 2,7, 5% van duizend waarnemingen is, is dat nog steeds een aanzienlijk aantal.
Het ontbreekt ons aan context als we dingen alleen in percentages bekijken. Dus ik ga mijn index hierheen slepen, dubbelslepen en wijzigen als een count .
En nu zien we zowel de verhoudingen als de frequenties. Ik zou hier zelfs overheen kunnen typen. Er is wat extra opmaak die we kunnen doen.
Frequentietabellen in Excel en proportietabellen zijn voor categorische variabelen. We moeten ze tellen. Er is geen andere wiskunde die we kunnen doen. We kunnen naar de ruwe cijfers kijken. We zouden ook naar de verhoudingen kunnen kijken.
Meerdere bladen in Excel toevoegen aan LuckyTemplates
Unpivot en Pivot Basics in LuckyTemplates – Query Editor Review
LuckyTemplates en Excel: verschil in DAX-formules
Conclusie
Ik hoop dat je iets leert over frequentie- en proportietabellen en hoe je dit in Excel kunt doen met behulp van die indexkolom.
De onbewerkte frequenties geven ons veel informatie over de gegevens omdat we deze niet kunstmatig verkleinen, maar het kan moeilijk zijn om de relatieve omvang van elk van die cijfers te vergelijken. Terwijl het met proportietabellen veel gemakkelijker is om naar dingen te kijken als ze in 100 worden gesneden. Maar in zekere zin kunnen we zeggen dat we de context verliezen als we dat doen.
Ik hoop dat je deze tutorial leuk vond. Zorg ervoor dat u de onderstaande links bekijkt voor meer gerelateerde inhoud.
Al het beste,
Wat is zelf in Python: voorbeelden uit de echte wereld
Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.
In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.
Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.
In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.
Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.
Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.
Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.
Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.
Wat is LuckyTemplates Gateway? Alles wat u moet weten