Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

Das Erstellen von Visualisierungen in R mit ggplot2 kann eine leistungsstarke Möglichkeit sein, Ihre Daten zu erkunden und zu verstehen. Eine gängige Art der Visualisierung ist das bivariate Diagramm, mit dem Sie die Beziehung zwischen zwei Variablen untersuchen können.

In diesem Tutorial erfahren Sie, wie Sie mit ggplot2 bivariate Visualisierungen in R erstellen. Dieser Blog konzentriert sich speziell auf Visualisierungen , die in LuckyTemplates schwierig, in R jedoch einfach durchzuführen wären.

Inhaltsverzeichnis

Überblick

In diesem Tutorial werden drei Hauptthemen behandelt. Sie erfahren, wie Sie die Verteilungen einer Variablen nach Gruppen visualisieren und wie Sie Korrelationen und paarweise Beziehungen visualisieren.

Eine paarweise Beziehung bezieht sich auf die Beziehung zwischen jedem Variablenpaar in einem bestimmten Datensatz.

Für dieses Tutorial müssen Sie das Paket ggplot2 herunterladen . Wenn Sie fertig sind, öffnen Sie ein leeres R- Skript und fügen Sie zwei Bibliotheken ein: Tidyverse und GGally .

Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

GGally ist eine Erweiterung zu ggplot2. Es wurde entwickelt, um die Komplexität der Kombination geometrischer Objekte mit transformierten Daten zu reduzieren.

Die verschiedenen bivariaten Visualisierungen in R

Eine bivariate Visualisierung zeigt die Beziehung zwischen zwei Variablen.

Lassen Sie uns als Beispiel eine Visualisierung erstellen, die die Beziehung zwischen der Stadt und der Autobahn zeigt. Sie müssen die Funktion ggplot() verwenden und dann die entsprechenden Daten zuweisen.

Anschließend wird die Funktion geom_point() zum Generieren des Streudiagramms verwendet .

Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

Visualisierungen in R, die Korrelation zeigen

Die Funktion ggcorr() wird verwendet, um die Korrelation zwischen Variablen zu visualisieren. Dadurch wird eine Heatmap erstellt, in der die niedrigsten bis höchsten Korrelationswerte angezeigt werden. Sie können die Visualisierung weiter verbessern, indem Sie ein Argument hinzufügen, das die Beschriftungen anzeigt.

Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

Visualisierungen in R, die eine paarweise Beziehung zeigen

Für die paarweise Darstellung müssen Sie die Funktion ggpairs() verwenden .

Da der Datenrahmen in diesem Beispiel einen großen Datensatz enthält, muss er zunächst gefiltert werden, um nur numerische Werte anzuzeigen. Andernfalls wird in den Ergebnissen ein Fehler angezeigt.

Um Daten zu filtern, verwenden Sie den Pipe-Operator und die Funktion select_if() .

Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

Auf der Registerkarte Diagramme können Sie die vom Code generierte paarweise Visualisierung sehen. Sie können auch das Diagramm und den Korrelationswert zwischen den einzelnen Variablen sehen.

Mit paarweisen Diagrammen können Sie auch zusätzliche Elemente hinzufügen, um die Visualisierung zu erweitern. Sie können eine weitere Variable hinzufügen und die Farbe der Daten ändern.

In diesem Fall wird die Laufwerksspalte zum Code hinzugefügt und die Funktion „Ästhetische Zuordnung“ verwendet, um ihre Farbe zu ändern.

Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

Wenn Sie den Code ausführen, werden Sie sehen, dass das Diagramm Streudiagramme und die Korrelationswerte nach Laufwerk anzeigt. Die Diagonale zeigt auch die Verteilung nach jedem Antrieb.

Erstellen Sie bivariate Visualisierungen in R mit Ggplot2

Abschluss

Wenn Sie robuste und statistisch abgesicherte Visualisierungen wie Histogramme, Streudiagramme und Boxplots erstellen möchten, empfiehlt sich die Verwendung von ggplot2 mit GGally.

Die Programmiersprache R ermöglicht Benutzern zusammen mit verschiedenen Visualisierungspaketen wie ggplot2 die Erstellung von Visualisierungen, die die Beziehung und Korrelation zwischen Variablen zeigen.

GGally erweitert ggplot2 durch die Erweiterung mehrerer Funktionen, die die Komplexität reduzieren. Wenn Sie versuchen, bivariate und multivariate Visualisierungen in LuckyTemplates zu erstellen, werden sich diese als Herausforderung erweisen. Innerhalb der Programmiersprache R müssen Sie jedoch nur eine einzige Codezeile schreiben, um zu dem benötigten statistischen Diagramm zu gelangen.

Alles Gute,

George Mount


Streudiagramm-Visualisierungen mit Charticulator

Streudiagramm-Visualisierungen mit Charticulator

In diesem Tutorial erfahren Sie, wie Sie mit Charticulator eine Streudiagramm-Visualisierung für Ihren LuckyTemplates-Bericht erstellen und entwerfen.

PowerApps-Suchfeld: So fügen Sie es hinzu und passen es an

PowerApps-Suchfeld: So fügen Sie es hinzu und passen es an

Erfahren Sie, wie Sie ein PowerApps-Suchfeld von Grund auf erstellen und es an das Gesamtthema Ihrer App anpassen.

Power Automate String-Funktionen: Substring und IndexOf

Power Automate String-Funktionen: Substring und IndexOf

Erlernen Sie ganz einfach zwei komplizierte Power Automate String-Funktionen, die in Microsoft Flows verwendet werden können – die Funktionen substring und indexOf.

Power Query M: Abwechselndes 0-1-Muster in der Datumstabelle

Power Query M: Abwechselndes 0-1-Muster in der Datumstabelle

Dieses Tutorial konzentriert sich auf die Power Query M-Funktion „number.mod“, um ein abwechselndes 0-1-Muster in der Datumstabelle zu erstellen.

Prognosetechnik: Erkundung der Prognoselogik in LuckyTemplates-Modellen

Prognosetechnik: Erkundung der Prognoselogik in LuckyTemplates-Modellen

In diesem Tutorial führe ich eine Prognosetechnik durch, bei der ich meine tatsächlichen Ergebnisse mit meinen Prognosen vergleiche und sie kumulativ betrachte.

Speichern Sie E-Mail-Anhänge in SharePoint mit Power Automate

Speichern Sie E-Mail-Anhänge in SharePoint mit Power Automate

In diesem Blog erfahren Sie, wie Sie mit Power Automate E-Mail-Anhänge automatisch in SharePoint speichern und E-Mails anschließend löschen.

Führen Sie eine Bis-Loop-Steuerung in Power Automate durch

Führen Sie eine Bis-Loop-Steuerung in Power Automate durch

Erfahren Sie, wie die Do Until Schleifensteuerung in Power Automate funktioniert und welche Schritte zur Implementierung erforderlich sind.

Berechnen eines gleitenden Durchschnitts in LuckyTemplates mithilfe von DAX

Berechnen eines gleitenden Durchschnitts in LuckyTemplates mithilfe von DAX

In diesem Tutorial erfahren Sie, wie Sie mithilfe der ALLSELECTED-Funktion einen dynamischen gleitenden Durchschnitt in LuckyTemplates berechnen können.

Berechnen Sie dynamisch eine laufende oder kumulative LuckyTemplates-Summe

Berechnen Sie dynamisch eine laufende oder kumulative LuckyTemplates-Summe

Durch diesen Artikel erhalten wir ein klares und besseres Verständnis für die dynamische Berechnung einer laufenden oder kumulativen Gesamtsumme in LuckyTemplates.

Power Automate auf jede Aktion in Workflows anwenden

Power Automate auf jede Aktion in Workflows anwenden

Erfahren und verstehen Sie die Bedeutung und ordnungsgemäße Verwendung der Power Automate-Aktionssteuerung „Auf jede anwenden“ in unseren Microsoft-Workflows.