Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

In diesem Tutorial werden Faktoren und Faktorstufen in R erläutert. Sie erfahren, wie Sie einen Faktor erstellen und Faktorstufen anpassen.

Faktoren werden zum Speichern und Arbeiten mit Variablen in R verwendet.

In diesem Tutorial befassen Sie sich mit kategorialen und ordinalen Variablen. Kategoriale Variablen sind Variablen, die eine oder mehrere Kategorien umfassen, die nicht in einer bestimmten Reihenfolge geordnet sind. Ein Beispiel wären Farben. Ordinale Variablen hingegen ähneln kategorialen Variablen mit dem Unterschied, dass ordinale Variablen eine klare Reihenfolge der Kategorien haben. Dies kann niedrig, mittel und hoch sein.

Dies ist eine Einführung in weitere statistische Begriffe. Sie erkunden nun langsam die Fähigkeiten von R für Daten- und statistische Analysen.

Inhaltsverzeichnis

Kategoriale Faktorstufen in R

Wenn Sie sich erinnern , haben Sie in einer anderen Lektion über Datenrahmen das Dollarzeichen ( $ ) verwendet, um die Spalte „Arten“ aus dem Iris- Datensatz auszudrucken . Wiederholen Sie dies erneut in RStudio . Im untersten Teil befindet sich eine Zeile mit Levels bestehend aus setosa , versicolor und virginica .

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Dies ist die Art und Weise, wie R mit Kategorien in Daten umgeht.

Wenn Sie die Funktion „unique()“ verwenden , listet R die eindeutigen Werte in der angegebenen Spalte auf. Wenn Sie beispielsweise unique (iris$Species) ausführen , zeigt die Konsole die drei Artenstufen der Iris an.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Für diese Ebenen gibt es keine inhärente Reihenfolge. Man kann nicht sagen, dass Setosa größer ist als die anderen beiden Farbkategorien. R ordnet sie standardmäßig in alphabetischer Reihenfolge an.

Ordnungsfaktorstufen in R

Versuchen wir nun, Faktoren anhand der inhärenten Reihenfolge der Kategorie zu untersuchen.

Erstellen Sie einen Vektor und nennen Sie ihn „orders“ . Weisen Sie diesem Vektor in diesem Beispiel Daten zu, indem Sie die Tassengrößennamen von Starbucks verwenden: „tall“, „venti“ und „grande“. Dann drucken Sie es aus.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Diese sollten vom Kleinsten zum Größten angeordnet werden; Es sollte hoch, venti und grande sein. Wenn Sie jedoch die Funktion „unique()“ für Bestellungen ausführen , werden diese nicht in dieser Reihenfolge angeordnet.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Hier erfahren Sie, wie Sie sie in Ordinalvariablen umwandeln. Zuerst müssen Sie einen neuen Vektor erstellen. In diesem Fall heißt der Vektor new_orders_factor . Weisen Sie diesem Vektor die Funktion Faktor () zu . Geben Sie in dieser Funktion den Vektor ein, mit dem Sie die Ebenen festlegen möchten. Geben Sie dann die Ebenen in der Reihenfolge an, in der sie angezeigt werden sollen.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Markieren Sie diese gesamte Codezeile und führen Sie sie dann aus. Anschließend wird in der Umgebung ein neuer Wert hinzugefügt.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Um zu überprüfen, ob ein Vektor ordnungsgemäß als Faktor zugewiesen wurde, verwenden Sie die Funktion is.factor() . Wenn Sie die beiden Vektoren „ orders “ und „new_orders_factor“ überprüfen , können Sie sehen, dass ersterer FALSE zurückgibt, während der neue Vektor tatsächlich ein Faktor ist.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Ein Faktor ist eine spezielle Möglichkeit, eine Reihe von Texten zu speichern. Und obwohl es sich um einen Zeichenvektor handelt, kann er so gespeichert werden, dass er eine bestimmte Anzahl von Kategorien mit einer bestimmten Reihenfolge von Werten oder Ebenen haben kann.

Wenn Sie mit der Funktion Ebenen ( ) überprüfen , können Sie sehen, dass die Ebenen jetzt in der richtigen Reihenfolge sind.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen


Erstellen Sie Vektoren in R: Eine Schritt-für-Schritt-Anleitung.
Datenrahmen in R: Erlernen der Grundlagen

Abschluss

Obwohl diese Lektion esoterisch erscheinen mag, werden Sie sehen, welchen Unterschied dies beim Umgang mit fortgeschrittener R-Codierung macht. Es ist wichtig, mehr über Faktoren und Ebenen zu erfahren, da diese häufig in vielen R-Codierungen und statistischen Analysen vorkommen.


So speichern und laden Sie eine RDS-Datei in R

So speichern und laden Sie eine RDS-Datei in R

Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.

Was ist Self in Python: Beispiele aus der Praxis

Was ist Self in Python: Beispiele aus der Praxis

Was ist Self in Python: Beispiele aus der Praxis

First N Business Days Revisited – Eine DAX-Codierungssprachenlösung

First N Business Days Revisited – Eine DAX-Codierungssprachenlösung

In diesem Tutorial zur DAX-Codierungssprache erfahren Sie, wie Sie die GENERATE-Funktion verwenden und einen Kennzahltitel dynamisch ändern.

Präsentieren Sie Einblicke mithilfe der Multi-Threaded-Dynamic-Visuals-Technik in LuckyTemplates

Präsentieren Sie Einblicke mithilfe der Multi-Threaded-Dynamic-Visuals-Technik in LuckyTemplates

In diesem Tutorial erfahren Sie, wie Sie mithilfe der Multi-Threaded-Dynamic-Visuals-Technik Erkenntnisse aus dynamischen Datenvisualisierungen in Ihren Berichten gewinnen.

Einführung in den Filterkontext in LuckyTemplates

Einführung in den Filterkontext in LuckyTemplates

In diesem Artikel werde ich den Filterkontext durchgehen. Der Filterkontext ist eines der Hauptthemen, über die sich jeder LuckyTemplates-Benutzer zunächst informieren sollte.

Beste Tipps zur Verwendung der Apps im LuckyTemplates-Onlinedienst

Beste Tipps zur Verwendung der Apps im LuckyTemplates-Onlinedienst

Ich möchte zeigen, wie der LuckyTemplates Apps-Onlinedienst bei der Verwaltung verschiedener Berichte und Erkenntnisse aus verschiedenen Quellen helfen kann.

Analysieren Sie Gewinnmargenänderungen im Laufe der Zeit – Analysen mit LuckyTemplates und DAX

Analysieren Sie Gewinnmargenänderungen im Laufe der Zeit – Analysen mit LuckyTemplates und DAX

Erfahren Sie, wie Sie Ihre Gewinnmargenänderungen mithilfe von Techniken wie Kennzahlenverzweigung und der Kombination von DAX-Formeln in LuckyTemplates ermitteln.

Materialisierungsideen für Datencaches in DAX Studio

Materialisierungsideen für Datencaches in DAX Studio

In diesem Tutorial werden die Ideen der Materialisierung von Datencaches und deren Auswirkungen auf die Leistung von DAXs bei der Bereitstellung von Ergebnissen erläutert.

Geschäftsberichte mit LuckyTemplates

Geschäftsberichte mit LuckyTemplates

Wenn Sie bisher noch Excel verwenden, ist dies der beste Zeitpunkt, LuckyTemplates für Ihre Geschäftsberichtsanforderungen zu verwenden.

Was ist LuckyTemplates Gateway? Alles was du wissen musst

Was ist LuckyTemplates Gateway? Alles was du wissen musst

Was ist LuckyTemplates Gateway? Alles was du wissen musst