Factorniveaus in R: categorische en ordinale variabelen gebruiken

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Deze tutorial behandelt factoren en factorniveaus in R. Je leert hoe je een factor maakt en hoe je factorniveaus aanpast.

Factoren worden gebruikt om variabelen in R op te slaan en ermee te werken.

In deze zelfstudie krijgt u te maken met categorische en ordinale variabelen. Categorische variabelen zijn variabelen die betrekking hebben op een of meer categorieën die niet op een specifieke manier zijn geordend. Een voorbeeld zijn kleuren. Ordinale variabelen daarentegen zijn vergelijkbaar met categorische variabelen, met het verschil dat ordinale variabelen een duidelijke volgorde van de categorieën hebben. Dit kan laag, gemiddeld en hoog zijn.

Dit is een inleiding tot meer statistische termen. U verkent nu langzaam de mogelijkheden van R voor gegevens- en statistische analyse.

Inhoudsopgave

Categorische factorniveaus in R

Als u zich in een andere les over dataframes herinnert, hebt u het dollarteken ( $ ) gebruikt om de kolom Species uit de iris- dataset af te drukken . Doe dit opnieuw in RStudio . Helemaal onderaan is er een regel met niveaus die zijn samengesteld uit setosa , versicolor en virginica .

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Dit is de manier waarop R omgaat met categorieën in gegevens.

Als u de functie uniek ( ) gebruikt , geeft R de unieke waarden in de opgegeven kolom weer. Als u bijvoorbeeld unique (iris$Species) uitvoert , geeft de console de drie irisniveaus weer.

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Er is geen inherente volgorde voor deze niveaus. Je kunt niet zeggen dat setosa groter is dan de andere twee kleurcategorieën. R rangschikt ze standaard in alfabetische volgorde.

Ordinale factorniveaus in R

Laten we nu proberen factoren te onderzoeken die inherent zijn aan de categorie.

Maak een vector en noem deze orders . Wijs voor dit voorbeeld die vector toe met gegevens met behulp van de cupmaatnamen van Starbucks: tall, venti en grande. Print het dan uit.

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Deze moeten worden gerangschikt van klein naar groot; het moet lang, venti en groots zijn. Maar wanneer u de unieke ( ) functie voor bestellingen uitvoert , worden ze niet in die volgorde gerangschikt.

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Hier leest u hoe u ze kunt omzetten in ordinale variabelen. Eerst moet u een nieuwe vector maken. In dit geval wordt de vector nieuwe_orders_factor genoemd . Wijs deze vector toe met de functie factor ( ) . Voer binnen deze functie de vector in waarmee u niveaus wilt instellen. Geef vervolgens niveaus aan in de volgorde waarin u ze wilt weergeven.

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Markeer deze hele coderegel en voer deze vervolgens uit. Er wordt dan een nieuwe Waarde toegevoegd in Omgeving.

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Gebruik de functie is.factor ( ) om te controleren of een vector correct is toegewezen als een factor . Als je de twee vectoren, orders en new_orders_factor controleert , kun je zien dat de eerste FALSE retourneert terwijl de nieuwe vector inderdaad een factor is.

Factorniveaus in R: categorische en ordinale variabelen gebruiken

Een factor is een speciale manier om een ​​reeks teksten op te slaan. En hoewel het een karaktervector is, kan het zo worden opgeslagen dat het een bepaald aantal categorieën heeft met een specifieke volgorde van waarden of niveaus.

Als u dit controleert met behulp van de functie niveaus ( ) , kunt u zien dat de niveaus nu in de juiste volgorde staan.

Factorniveaus in R: categorische en ordinale variabelen gebruiken


Maak vectoren in R: een stapsgewijze zelfstudie
Dataframes in R: de basis leren

Conclusie

Hoewel deze les misschien esoterisch lijkt, zul je zien hoe dit een verschil maakt bij het omgaan met meer geavanceerde R-codering. Het is belangrijk om meer te weten te komen over factoren en niveaus, aangezien deze vaak voorkomen in veel R-coderingen en statistische analyses.


Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Een RDS-bestand opslaan en laden in R

Een RDS-bestand opslaan en laden in R

Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.

First N Business Days Revisited – Een DAX-coderingstaaloplossing

First N Business Days Revisited – Een DAX-coderingstaaloplossing

In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.

Inleiding tot het filteren van context in LuckyTemplates

Inleiding tot het filteren van context in LuckyTemplates

In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.

Zakelijke rapportage met behulp van LuckyTemplates

Zakelijke rapportage met behulp van LuckyTemplates

Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten