Dataframes in R: de basis leren

Dataframes in R: de basis leren

In eerdere zelfstudies leerde u over objecten, objectklassen en vectoren . Voor deze zelfstudie leert u over dataframes in R.

Dataframes zijn in wezen vectoren die met elkaar zijn gecombineerd om rijen en kolommen met gegevens te vormen.

Dataframes in R: de basis leren

Een kolom bestaat uit één vector. In het bovenstaande voorbeeld is de eerste kolom dus een tekenreekskolom, gevolgd door een numerieke kolom en vervolgens een logische kolom. Dit is vergelijkbaar met hoe een tabel eruit zou zien in LuckyTemplates.

U moet ook onthouden dat er voor dataframes hetzelfde aantal items voor alle kolommen moet zijn. Dat wil zeggen, er moet een consistent aantal rijen zijn.

Wanneer u de R-programmeertaal gebruikt , werkt u meestal met dataframes. Het is dus belangrijk om te begrijpen wat ze zijn en hoe ze kunnen worden gebruikt.

Inhoudsopgave

Een verzonden dataframe laden en bekijken

RStudio wordt al geleverd met verzonden dataframes die u kunt gebruiken. Om ze te identificeren, moet u de functie data ( ) gebruiken .

Open RStudio en voer gegevens uit ( ) . U hoeft geen argument tussen haakjes te plaatsen.

Dataframes in R: de basis leren

Als u klaar bent, ziet u een lijst met ingebouwde datasets in R die u kunt gebruiken.

Dataframes in R: de basis leren

Ze zijn erg handig om te oefenen en vertrouwd te raken met het gebruik van dataframes in R.

De meest gebruikte ingebouwde dataset is iris . Iris wordt vaak gebruikt bij het leren van datawetenschap of data-analyse in het algemeen. Druk de iris af zodat u de gegevens in de console kunt zien.

Dataframes in R: de basis leren

Je ziet dat er veel gegevens zijn. Als u omhoog scrolt, ziet u dat het uit verschillende kolommen is samengesteld.

Dataframes verkennen in R met behulp van functies

Een van de manieren om de gegevens beter te bekijken, is door de view ( ) functie te gebruiken. Wanneer u de codeweergave (iris) uitvoert , ziet u een nieuw tabblad met een tabel verschijnen in RScript.

Dataframes in R: de basis leren

Wat de weergave ( ) beter maakt, is dat u aanpassingen aan de tabel kunt maken. U kunt de volgorde van de gegevens aanpassen door de pijlen op elke kolomtitel te gebruiken. Er is ook een filterknop.

U kunt ook op het icoon naast filter klikken om de gegevens in een nieuw venster te openen.

Dataframes in R: de basis leren

Dit nieuwe venster is vergelijkbaar met Power Query , waar u de gegevens kunt bekijken maar niet kunt aanraken. Dat wil zeggen dat u geen waarden kunt invoeren of vervangen bovenop de bestaande gegevens.

Een andere handige functie om te weten is de head ( ) functie. Deze functie drukt de eerste rijen van de dataset af.

Dus als u head (iris) uitvoert , ziet u dat alleen de eerste zes rijen worden afgedrukt. 

Dataframes in R: de basis leren

Dit is geweldig als u uw gegevens beter wilt begrijpen. De console is niet overweldigd en de gegevenspresentatie is netter.

Dataframes indexeren

Indexeren is ook besproken in een eerdere tutorial over vectoren. U hoeft alleen vierkante haken ( [ ] ) te gebruiken om een ​​positie te indexeren. Aangezien dataframes zijn samengesteld uit rijen en kolommen, moet u beide indexeren. Het formaat is naam [rij, kolom] .

Als u bijvoorbeeld de 2e rij en 4e kolom van de irisdataset wilt indexeren , voert u gewoon iris [2, 4] uit .

Dataframes in R: de basis leren

U kunt ook een rij- en kolombereik indexeren. U hoeft alleen maar een dubbele punt ( : ) te gebruiken om het bereik aan te geven. Hier is een voorbeeld:

Dataframes in R: de basis leren

U kunt ook een hele kolom indexeren. Gebruik het dollarteken ( $ ) achter de naam van de dataset en geef de gewenste kolomnaam aan. Als u bijvoorbeeld de hele kolom met de naam Species wilt indexeren, voert u iris$Species uit .

Dataframes in R: de basis leren

U zult dan zien dat de hele kolom Soort is afgedrukt in de console.

Gegevensframestatistieken weergeven in R

Zoals u in eerdere zelfstudies hebt geleerd, is R gebouwd met het oog op gegevensanalyse, statistieken en visualisaties. Dus een ander nuttig ding om te leren over dataframes in R is hoe je ze kunt samenvatten.

Wanneer u de samenvattingsfunctie ( ) gebruikt , retourneert de console de samenvattingsstatistieken voor die gegevens.

Loop samenvatting (iris) . Dit geeft u basisinformatie over de dataset in termen van beschrijvende statistieken.

Dataframes in R: de basis leren

Er zijn andere pakketten om meer samenvattende statistieken te krijgen, zoals standaarddeviatie en kurtosis. Maar deze zullen in volgende tutorials worden besproken.


Maak vectoren in R: een stapsgewijze zelfstudie

Conclusie

Je hebt de componenten van R geleidelijk geleerd. Eerst leerde je over objecten, daarna ging je verder met vectoren, tot aan deze les over dataframes. Je hebt nu te maken met grotere en complexere gegevens.

Met dataframes ben je nu beter bekend met de verschillende datasets in R en heb je geleerd hoe je tot basisstatistische informatie komt.

U zult progressief blijven leren terwijl de volgende tutorials gaan over manieren om grotere gegevens in R op te schalen en te verkennen.


Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Een RDS-bestand opslaan en laden in R

Een RDS-bestand opslaan en laden in R

Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.

First N Business Days Revisited – Een DAX-coderingstaaloplossing

First N Business Days Revisited – Een DAX-coderingstaaloplossing

In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.

Inleiding tot het filteren van context in LuckyTemplates

Inleiding tot het filteren van context in LuckyTemplates

In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.

Zakelijke rapportage met behulp van LuckyTemplates

Zakelijke rapportage met behulp van LuckyTemplates

Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten