So speichern und laden Sie eine RDS-Datei in R
Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.
Parallele Koordinatendiagramme sind ein nützliches Visualisierungstool, mit dem Beziehungen zwischen mehreren Variablen dargestellt werden, die dieselben numerischen Daten verwenden. In LuckyTemplates werden diese Diagramme mit sehr einfachem Python-Code erstellt, den Sie verwenden und problemlos erstellen und stilisieren können.
Im heutigen Blog erfahren wir, wie man mit Python multivariate oder parallele Koordinatendiagramme erstellt . Wir werden den Prozess Schritt für Schritt durchgehen, von der Vorbereitung der Daten bis zur Anpassung des Plots für eine bessere Lesbarkeit. Das vollständige Video dieses Tutorials können Sie unten in diesem Blog ansehen .
Inhaltsverzeichnis
Parallele Koordinatendiagramme in Python: Beispiel 1
Dies ist unsere erste Handlung. Es zeigt unsere drei Variablen – Variable A, B und C – und die beiden Linien, die die Elemente 1 und 2 darstellen.
Das heißt, wir haben zwei Datensätze, einen für Item 1 und einen für Item 2. Und für jeden Datensatz haben wir unsere drei Variablen.
Schauen wir uns die Daten an, um besser zu verstehen, wie die Handlung aufgebaut war.
Markieren Sie zunächst das Diagramm. Klicken Sie auf Daten.
Es sollte eine Tabelle mit sehr einfachen Daten erscheinen. Es wurde mit der Option „Tabelle einfügen“ erstellt. Wir können sehen, dass in den Spalten die Variablen A, B und C für jedes Element enthalten sind, die in jeder Zeile getrennt sind.
Wir haben einfache Daten, aber wir können daraus etwas sehr Aussagekräftiges machen. In unserem Diagramm können wir beispielsweise feststellen, dass die Beziehung zwischen den Daten recht „niedrig“ ist.
Zur Veranschaulichung können wir dieses Diagramm mit unseren Daten vergleichen. Variable B in Item 1 beträgt 100 und in Item 2 115, wie in der Grafik dargestellt.
Wir können auch erkennen, wie die Elemente und Variablen zusammenhängen. Beispielsweise können wir leicht erkennen, dass Variable A niedriger ist als B und dass C die niedrigste der drei ist.
Der Plot-Python-Code
Fahren wir nun mit dem Python- Code fort, der für die eigentliche Handlung verwendet wird.
Wählen Sie zunächst im Bereich „Visualisierungen“ die Option „Python visual“ aus .
Markieren Sie unser erstes Diagramm, um den Python-Skripteditor zu öffnen .
Zuerst importieren wir matplotlib.pyplot und speichern es als Variable plt.
Dann bringen wir die pandas.plotting- Funktionen ein. Pandas dient als Datenmanipulationsbibliothek in LuckyTemplates. Es wird hauptsächlich zum Bearbeiten von Daten verwendet, verfügt aber auch über Plotfunktionen.
Importieren wir parallel_coordinates aus pandas.plotting . Parallel_coordinates ist die Hauptfunktion zum Erstellen des Diagramms.
Die Handlung in Python erstellen
In Zeile 13 dokumentieren wir, was wir tun werden, indem wir # make a plot schreiben.
Wir verwenden parallel_coordinates und übergeben den Datensatz.
In Zeile 3 können wir sehen, dass der Datensatz mit der Funktion pandas.DataFrame() erstellt wurde . Dann fügen wir Element, Variable A, Variable B und Variable C hinzu, die sich dann in unserer Werteliste widerspiegeln .
In Zeile 4 wird der Datensatz mit dataset.drop_duplicates() dedupliziert.
Wir können zum Bereich „Visualisierungen“ gehen, um die von uns hinzugefügten Werte anzuzeigen .
Das Entfernen eines dieser Werte wirkt sich auf unsere visuelle Darstellung aus. Wenn wir beispielsweise Variable C entfernen, ändern sich die Koordinaten entsprechend und zeigen uns, wie die Werte funktionieren.
Bringen wir unsere Variable C zurück , indem wir das Kontrollkästchen daneben unter „ Daten“ im Bereich „Felder“ aktivieren .
Als nächstes übergeben Sie die Funktion parallel_coordinates , die einige verschiedene Argumente akzeptiert. In unserem Fall werden der Datensatz und das Element verwendet, die den Typ und die Dimension unseres Datensatzes bereitstellen.
Wenn wir Item aus unserer Funktion entfernen und ausführen, funktioniert das Visual nicht.
Wir erhalten einen Python-Skriptfehler, der besagt, dass der Funktion parallel_coordinates() ein erforderliches Positionsargument fehlt, nämlich die Klassenspalte.
Fügen wir also Item wieder hinzu. Da es sich um eine Position handelt, müssen wir keine Klassenkoordinaten schreiben. Sobald wir fertig sind, können wir den Code ausführen.
Darstellung der Handlung in Python
Der nächste Schritt besteht darin, die Handlung anzuzeigen. In Zeile 16 dokumentieren wir also, was wir tun werden, indem wir # show the plot schreiben.
Denken Sie daran, dass wir matplotlib.pyplot zuvor importiert und als plt gespeichert haben . Wir haben das getan, weil wir die Funktion plt.show( ) benötigen, um unseren Plot anzuzeigen.
Parallele Koordinatendiagramme in Python: Beispiel 2
Unser zweiter Plot ist ein Iris-Datensatz, der petal_length, petal_width, sepal_length und sepal_width zeigt . Es hat etwas mehr Stil im Vergleich zur ersten Grafik.
Dieser Datensatz wurde mit Python-Code erstellt.
Um unsere Daten anzuzeigen, klicken Sie auf Daten transformieren und gehen Sie zum iris_dataset.
Der Datensatz enthält Spalten für die Abmessungen – Kelchblattlänge , Kelchblattbreite , Blütenblattlänge und Blütenblattbreite . Es gibt auch eine Spalte für den Artentyp .
Der Datensatz-Python-Code
Unsere Daten wurden einfach mit Python-Code eingespielt. Gehen Sie zur Quelle , um das Python-Skript anzuzeigen.
Unser Python-Code besteht nur aus zwei Zeilen. In der ersten Zeile haben wir Seaborn importiert und als Variable sns gespeichert . Wir haben unseren Datensatz iris_dataset genannt und die Variable sns verwendet, um den Datensatz mithilfe der Funktion sns.load_dataset('iris') zu laden .
Klicken Sie auf „OK“ , um die oben angezeigten Daten abzurufen. Navigieren Sie durch die Daten, und wenn Sie fertig sind, können Sie den Datensatz schließen, indem Sie auf „ Schließen & Anwenden“ > „Schließen“ klicken .
Plots in Python gestalten
Um den Python-Skripteditor für unser stilisierteres Diagramm zu öffnen, klicken Sie auf unseren zweiten Plot.
Wir beginnen mit dem Importieren von matplotlib.pyplot als plt.
Anschließend verwenden wir die Funktion plt.style.use („dark_background“), um das Bild zu formatieren.
Mit der Stylesheet-Referenz von matplotlib können wir den Hintergrund ganz einfach an unseren bevorzugten Stil anpassen . In unserem Fall haben wir einen dunklen Hintergrund verwendet.
Versuchen wir es auch mit ggplot , einem häufig verwendeten Stil.
Wenn wir es ausführen, erhalten wir ein Bild, das so aussieht.
Laden Sie dann die Pandas-Funktion für das Diagramm, indem Sie parallel_coordinates aus pandas.plotting importieren.
Um das Diagramm zu erstellen, bringen wir den Datensatz ein und legen unsere Spezies als Klasse fest .
Im Vergleich zu unserem ersten Diagramm fügen wir einen zusätzlichen Parameter hinzu, nämlich die Farbkarte, um verschiedene Farben zu erhalten. Übergeben Sie dies mithilfe der Matplotlib-Variable plt.get_cmap.
In der Colormap-Referenz der Matplotlib stehen viele Matplotlib-Farbvariablen zur Auswahl .
Beispielsweise verwenden wir derzeit Set 2 aus qualitativen Farbkarten, können dies aber auch in andere Farben ändern, z. B. HSV aus zyklischen Farbkarten.
Klicken Sie auf „Ausführen“, um einen Plot zu erhalten, der wie folgt aussieht.
Hsv sieht auf unseren Daten nicht besonders gut aus, aber wir können herumspielen, bis wir die am besten geeignete Farbkarte für unseren Plot gefunden haben.
Python-Korrelation: Leitfaden zum Erstellen visueller
Datensätze in Pandas mit ProfileReport() | Python in LuckyTemplates
Seaborn-Funktion in Python zur Visualisierung der Verteilung einer Variablen
Abschluss
In diesem Tutorial haben wir die Grundlagen der Erstellung paralleler Koordinatendiagramme in Python behandelt. Wir haben den Prozess der Vorbereitung der Daten, der Erstellung des Diagramms und der Anpassung des Diagramms zur besseren Lesbarkeit durchlaufen.
Parallele Koordinatendiagramme sind ein leistungsstarkes Werkzeug zur Visualisierung hochdimensionaler Daten und können in einer Vielzahl von Bereichen eingesetzt werden, darunter Finanzen, Ingenieurwesen und maschinelles Lernen. Nachdem wir nun wissen, wie man in Python parallele Koordinatendiagramme erstellt , können wir damit beginnen, sie zu verwenden, um unsere eigenen Daten besser zu verstehen und zu visualisieren.
Alles Gute,
Gaelim Holland
Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.
Was ist Self in Python: Beispiele aus der Praxis
In diesem Tutorial zur DAX-Codierungssprache erfahren Sie, wie Sie die GENERATE-Funktion verwenden und einen Kennzahltitel dynamisch ändern.
In diesem Tutorial erfahren Sie, wie Sie mithilfe der Multi-Threaded-Dynamic-Visuals-Technik Erkenntnisse aus dynamischen Datenvisualisierungen in Ihren Berichten gewinnen.
In diesem Artikel werde ich den Filterkontext durchgehen. Der Filterkontext ist eines der Hauptthemen, über die sich jeder LuckyTemplates-Benutzer zunächst informieren sollte.
Ich möchte zeigen, wie der LuckyTemplates Apps-Onlinedienst bei der Verwaltung verschiedener Berichte und Erkenntnisse aus verschiedenen Quellen helfen kann.
Erfahren Sie, wie Sie Ihre Gewinnmargenänderungen mithilfe von Techniken wie Kennzahlenverzweigung und der Kombination von DAX-Formeln in LuckyTemplates ermitteln.
In diesem Tutorial werden die Ideen der Materialisierung von Datencaches und deren Auswirkungen auf die Leistung von DAXs bei der Bereitstellung von Ergebnissen erläutert.
Wenn Sie bisher noch Excel verwenden, ist dies der beste Zeitpunkt, LuckyTemplates für Ihre Geschäftsberichtsanforderungen zu verwenden.
Was ist LuckyTemplates Gateway? Alles was du wissen musst