Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

In diesem Tutorial werden Faktoren und Faktorstufen in R erläutert. Sie erfahren, wie Sie einen Faktor erstellen und Faktorstufen anpassen.

Faktoren werden zum Speichern und Arbeiten mit Variablen in R verwendet.

In diesem Tutorial befassen Sie sich mit kategorialen und ordinalen Variablen. Kategoriale Variablen sind Variablen, die eine oder mehrere Kategorien umfassen, die nicht in einer bestimmten Reihenfolge geordnet sind. Ein Beispiel wären Farben. Ordinale Variablen hingegen ähneln kategorialen Variablen mit dem Unterschied, dass ordinale Variablen eine klare Reihenfolge der Kategorien haben. Dies kann niedrig, mittel und hoch sein.

Dies ist eine Einführung in weitere statistische Begriffe. Sie erkunden nun langsam die Fähigkeiten von R für Daten- und statistische Analysen.

Inhaltsverzeichnis

Kategoriale Faktorstufen in R

Wenn Sie sich erinnern , haben Sie in einer anderen Lektion über Datenrahmen das Dollarzeichen ( $ ) verwendet, um die Spalte „Arten“ aus dem Iris- Datensatz auszudrucken . Wiederholen Sie dies erneut in RStudio . Im untersten Teil befindet sich eine Zeile mit Levels bestehend aus setosa , versicolor und virginica .

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Dies ist die Art und Weise, wie R mit Kategorien in Daten umgeht.

Wenn Sie die Funktion „unique()“ verwenden , listet R die eindeutigen Werte in der angegebenen Spalte auf. Wenn Sie beispielsweise unique (iris$Species) ausführen , zeigt die Konsole die drei Artenstufen der Iris an.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Für diese Ebenen gibt es keine inhärente Reihenfolge. Man kann nicht sagen, dass Setosa größer ist als die anderen beiden Farbkategorien. R ordnet sie standardmäßig in alphabetischer Reihenfolge an.

Ordnungsfaktorstufen in R

Versuchen wir nun, Faktoren anhand der inhärenten Reihenfolge der Kategorie zu untersuchen.

Erstellen Sie einen Vektor und nennen Sie ihn „orders“ . Weisen Sie diesem Vektor in diesem Beispiel Daten zu, indem Sie die Tassengrößennamen von Starbucks verwenden: „tall“, „venti“ und „grande“. Dann drucken Sie es aus.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Diese sollten vom Kleinsten zum Größten angeordnet werden; Es sollte hoch, venti und grande sein. Wenn Sie jedoch die Funktion „unique()“ für Bestellungen ausführen , werden diese nicht in dieser Reihenfolge angeordnet.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Hier erfahren Sie, wie Sie sie in Ordinalvariablen umwandeln. Zuerst müssen Sie einen neuen Vektor erstellen. In diesem Fall heißt der Vektor new_orders_factor . Weisen Sie diesem Vektor die Funktion Faktor () zu . Geben Sie in dieser Funktion den Vektor ein, mit dem Sie die Ebenen festlegen möchten. Geben Sie dann die Ebenen in der Reihenfolge an, in der sie angezeigt werden sollen.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Markieren Sie diese gesamte Codezeile und führen Sie sie dann aus. Anschließend wird in der Umgebung ein neuer Wert hinzugefügt.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Um zu überprüfen, ob ein Vektor ordnungsgemäß als Faktor zugewiesen wurde, verwenden Sie die Funktion is.factor() . Wenn Sie die beiden Vektoren „ orders “ und „new_orders_factor“ überprüfen , können Sie sehen, dass ersterer FALSE zurückgibt, während der neue Vektor tatsächlich ein Faktor ist.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen

Ein Faktor ist eine spezielle Möglichkeit, eine Reihe von Texten zu speichern. Und obwohl es sich um einen Zeichenvektor handelt, kann er so gespeichert werden, dass er eine bestimmte Anzahl von Kategorien mit einer bestimmten Reihenfolge von Werten oder Ebenen haben kann.

Wenn Sie mit der Funktion Ebenen ( ) überprüfen , können Sie sehen, dass die Ebenen jetzt in der richtigen Reihenfolge sind.

Faktorstufen in R: Verwendung kategorialer und ordinaler Variablen


Erstellen Sie Vektoren in R: Eine Schritt-für-Schritt-Anleitung.
Datenrahmen in R: Erlernen der Grundlagen

Abschluss

Obwohl diese Lektion esoterisch erscheinen mag, werden Sie sehen, welchen Unterschied dies beim Umgang mit fortgeschrittener R-Codierung macht. Es ist wichtig, mehr über Faktoren und Ebenen zu erfahren, da diese häufig in vielen R-Codierungen und statistischen Analysen vorkommen.


Streudiagramm-Visualisierungen mit Charticulator

Streudiagramm-Visualisierungen mit Charticulator

In diesem Tutorial erfahren Sie, wie Sie mit Charticulator eine Streudiagramm-Visualisierung für Ihren LuckyTemplates-Bericht erstellen und entwerfen.

PowerApps-Suchfeld: So fügen Sie es hinzu und passen es an

PowerApps-Suchfeld: So fügen Sie es hinzu und passen es an

Erfahren Sie, wie Sie ein PowerApps-Suchfeld von Grund auf erstellen und es an das Gesamtthema Ihrer App anpassen.

Power Automate String-Funktionen: Substring und IndexOf

Power Automate String-Funktionen: Substring und IndexOf

Erlernen Sie ganz einfach zwei komplizierte Power Automate String-Funktionen, die in Microsoft Flows verwendet werden können – die Funktionen substring und indexOf.

Power Query M: Abwechselndes 0-1-Muster in der Datumstabelle

Power Query M: Abwechselndes 0-1-Muster in der Datumstabelle

Dieses Tutorial konzentriert sich auf die Power Query M-Funktion „number.mod“, um ein abwechselndes 0-1-Muster in der Datumstabelle zu erstellen.

Prognosetechnik: Erkundung der Prognoselogik in LuckyTemplates-Modellen

Prognosetechnik: Erkundung der Prognoselogik in LuckyTemplates-Modellen

In diesem Tutorial führe ich eine Prognosetechnik durch, bei der ich meine tatsächlichen Ergebnisse mit meinen Prognosen vergleiche und sie kumulativ betrachte.

Speichern Sie E-Mail-Anhänge in SharePoint mit Power Automate

Speichern Sie E-Mail-Anhänge in SharePoint mit Power Automate

In diesem Blog erfahren Sie, wie Sie mit Power Automate E-Mail-Anhänge automatisch in SharePoint speichern und E-Mails anschließend löschen.

Führen Sie eine Bis-Loop-Steuerung in Power Automate durch

Führen Sie eine Bis-Loop-Steuerung in Power Automate durch

Erfahren Sie, wie die Do Until Schleifensteuerung in Power Automate funktioniert und welche Schritte zur Implementierung erforderlich sind.

Berechnen eines gleitenden Durchschnitts in LuckyTemplates mithilfe von DAX

Berechnen eines gleitenden Durchschnitts in LuckyTemplates mithilfe von DAX

In diesem Tutorial erfahren Sie, wie Sie mithilfe der ALLSELECTED-Funktion einen dynamischen gleitenden Durchschnitt in LuckyTemplates berechnen können.

Berechnen Sie dynamisch eine laufende oder kumulative LuckyTemplates-Summe

Berechnen Sie dynamisch eine laufende oder kumulative LuckyTemplates-Summe

Durch diesen Artikel erhalten wir ein klares und besseres Verständnis für die dynamische Berechnung einer laufenden oder kumulativen Gesamtsumme in LuckyTemplates.

Power Automate auf jede Aktion in Workflows anwenden

Power Automate auf jede Aktion in Workflows anwenden

Erfahren und verstehen Sie die Bedeutung und ordnungsgemäße Verwendung der Power Automate-Aktionssteuerung „Auf jede anwenden“ in unseren Microsoft-Workflows.