So speichern und laden Sie eine RDS-Datei in R
Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.
In diesem Blog wird die Verwendung eines kumulativen Verteilungsdiagramms , auch bekannt als empirische kumulative Verteilungsfunktion oder ECDF-Diagramme, demonstriert und die Vorteile der Verwendung dieser Diagrammvariation gegenüber anderen Diagrammtypen aufgezeigt. Das vollständige Video dieses Tutorials können Sie unten in diesem Blog ansehen .
Die meisten Menschen bevorzugen ECDF-Diagramme gegenüber , um die Daten zu visualisieren, da sie jeden Datenpunkt direkt darstellen. Diese Funktion erleichtert dem Benutzer die Interaktion mit dem Diagramm. Heute erfahren Sie, wie Sie ein ECDF in Python und LuckyTemplates verwenden und Ihre Präsentationen und Berichte zur Datenverteilung verbessern.
Inhaltsverzeichnis
Arten von Verteilungsgrundstücken
Ich beginne damit, meine Daten an einem bestimmten Tag, Samstag, zu filtern. Unten sehen wir alle diese Python-Diagramme, die zur Beschreibung von Verteilungen verwendet werden. Wir haben hier unseren ECDF-Plot, ein Histogramm, einen KDE-Plot und einen Box-Plot.
Alle diese Diagramme beschreiben, wie Daten verteilt oder verteilt werden. Wenn wir beispielsweise nach unten gehen und uns das Histogramm ansehen, können wir erkennen, dass sich unsere Daten in den meisten dieser hohen Behälter befinden.
Mit rund 3,50 $ haben wir in unserem Datensatz unten den höchsten Wert für unsere Tipps- Daten.
Wir können auch einen KDE-Plot verwenden, der uns bei der Betrachtung der Verteilung eine andere Metrik liefert. Das Histogramm befasst sich mit der Anzahl, die sich in diesen Behältern befindet, während KDE sich mit der Dichte befasst.
Mit einem KDE-Diagramm können Sie erkennen, wo sich die meisten unserer Daten befinden, indem Sie die größte Dichte oder, wenn Sie so wollen, die höchste Ausbuchtung im Diagramm erkennen. Im Bild oben können wir also sagen, dass die Verteilung irgendwo zwischen 2 und 4 US-Dollar liegt.
Das Gleiche gilt für ein Boxdiagramm, das zeigt, dass die Verteilung 2 bis 4 US-Dollar beträgt, und dort werden sich die meisten unserer Daten befinden. Es verwendet einen Median, die horizontale Linie, die das Feld teilt, um uns eine Vorstellung davon zu geben, wo die größte Verteilung besteht.
Und dann haben wir das ECDF-Diagramm, in dem Sie auf der linken Seite der Y-Achse das Wort Proportion sehen können , das unsere Perzentile darstellt. Basierend auf dem Diagramm betrachten wir bei 3,50 $ etwa 50 % unserer Daten, und bei 5 $ und darunter sind 80 % unserer Daten verteilt.
Histogramm-Plotcode
Jetzt zeige ich Ihnen den Code für jedes dieser Diagramme, beginnend mit dem Histogramm. Sie verfügen alle über eine sehr ähnliche und wiederholbare Codierung , sodass Sie sie schnell mithilfe eines Codes wie einer Vorlage abrufen können.
Wir müssen zuerst Seaborn importieren und als sb speichern , gefolgt von matplotlib.pyplot als plt. Wir verwenden einen Hintergrundstil namens ggplot und diese Matplotlib- Variable, um verschiedene Stile zu übergeben.
Im Bild unten sehen wir beispielsweise, dass wir in der 11. Zeile einen Titel für das Histogramm und die Teilstrichgrößen in den folgenden Zeilen hinzufügen. Die Yticks und Xticks repräsentieren entsprechend die x- und y-Größen.
In der 14. Zeile verwenden wir eine Seaborn-Variable, um die Funktion zu übergeben , die diesen bestimmten Plot einbringt, wie den Histoplot im obigen Beispiel, der einen Histogrammplot darstellt. Anschließend übergeben wir die Daten aus der 4. Zeile als Datensatz an die Funktion.
Alles, was Sie in die Werte einfügen, stellt Ihren Datensatz dar und löscht die Duplikate. Dann verwenden wir x für die Spitzen und einen Farbton, der es Ihnen zusammen mit seaborn ermöglicht, Ihre Daten nach Kategorien zu unterteilen. Wenn wir zu unserem Bild zurückkehren, können wir feststellen, dass es Kategorien hat, darunter „The“, „Time“ oder „Raucher“.
KDE-Plot
Beim KDE-Plot ist alles nahezu identisch. Wir müssen nur einen neuen Parameter namens „Shade“ übergeben, um dieses schattierte Aussehen zu erhalten. Ansonsten sind der Farbton, die Daten und der Rest gleich.
Der Box-Plot ähnelt bis auf ein paar kleinere Unterschiede größtenteils anderen Plots. Hier verwenden wir die Boxplot-Funktion , wobei x der Tag und y die Tipps sind. Wir verwenden für diesen Plot auch keinen Farbton .
Es ist also die gleiche Struktur wie das ECDF-Diagramm und der einzige Unterschied besteht in der Seaborn-Variablen, wo wir ein ECDF-Diagramm übergeben und den Farbton als Tag verwenden. Wir können diesen Farbton aber auch in eine andere Kategorie ändern, beispielsweise „Raucher“.
Wenn wir diese Kategorie übergeben, erhalten wir ein ECDF-Diagramm mit zwei verschiedenen Linien. In diesen Verteilungen können wir sehen, dass die Raucher mehr über unsere spezielle Linienbreite wissen.
Bei Nichtrauchern liegt dieser Wert zu hundert Prozent unter 6 US-Dollar, bei Rauchern bei 6 US-Dollar. Interessanterweise geben unsere Raucher an einem bestimmten Tag möglicherweise ein größeres Trinkgeld.
Styling von ECDF-Plots
Jetzt können wir unsere ECDF-Plots weiter gestalten, um sie ansehnlicher zu machen. Im Bild unten sind verschiedene ECDF-Diagramme zu sehen. Im ersten Plot habe ich die Linien größer gemacht und eine andere Farbpalette verwendet.
Im ersten Plot habe ich verschiedene Parameter innerhalb der Funktion verwendet. Wie Sie unten sehen können, habe ich die Palette als Sommer und die Linienstärke als 5 übergeben.
Ich habe auch Samstag und Sonntag verglichen, weshalb es zwei verschiedene grüne Linien gibt. Hier sehen wir, dass das Trinkgeld von 3 $ für Sonntag beim 45. Perzentil und für Donnerstag beim 70. Perzentil liegt, was uns zeigt, dass die Leute dazu neigen, am Sonntag höhere Trinkgelder zu geben.
Wir können auch die X- und Y-Achse vertauschen, die Proportionen und die Spitze innerhalb unseres Plots vertauschen und die Palette ändern, genau wie im Bild unten.
Hier können wir sehen, dass das Trinkgeld von 2 $ für Sonntag beim 20. Perzentil liegt, was der violetten Linie im Diagramm entspricht. Die Daten stimmen also mit denen des vorherigen ECDF-Diagramms überein und nur die Darstellung unterscheidet sich.
Wir haben jetzt ein weiteres Diagramm mit demselben Datensatz und behalten die ursprünglichen Achsenpositionen bei, wie im Bild oben gezeigt. Der Unterschied besteht dieses Mal darin, dass die Richtung der Linien umgekehrt ist.
ECDF-Diagrammstil
Wenn wir uns den Code ansehen, übergeben wir lediglich den Parameter „complementary equal = true“. Mit dieser Aktion können wir sagen, dass im Bereich von 2 $ und darüber 80 % unserer Daten verteilt sind, anstatt zu sagen, dass unterhalb des 2-Dollar-Bereichs 20 % unserer Daten verteilt sind. Auch hier handelt es sich um dieselben Daten mit einem anderen Aussehen oder einer anderen Darstellungsweise.
Und in unserem vierten und letzten ECDF-Diagramm verwenden wir Count statt Proportion.
Dieser Ansatz ist hilfreich, wenn wir mehr als ein paar Grundstücke haben. Wenn wir uns die Zählspalte im Bild unten ansehen, können wir sehen, dass es am Freitag nicht viele Beobachtungen gibt, was uns sagt, dass die Leute an diesem Tag nicht viele Trinkgelder hinterlassen.
ECDF stellt Code-Grundlagen dar
Wenn wir uns den Code ansehen, finden Sie Seaborn , das die Hauptsache für die Erstellung dieser speziellen Handlung ist. Wir haben auch matplotlib.pyplot für das Styling, das Sie als Variable namens plt speichern können .
Mithilfe dieser Variablen können wir dann verschiedene Stile für unseren jeweiligen Plot erstellen, beispielsweise Titel und Schriftgrößen hinzufügen. Der Hauptteil Ihres Codes wird Ihre ECDF-Plotfunktion sein, die wir mit Seaborn einbinden.
Streudiagramm in R-Skript: So erstellen und importieren Sie
benutzerdefinierte Python-Funktionen | Ein Überblick
über GGPLOT2 in R: Visualisierungen mit ESQUISSE
Abschluss
Auf diese Weise können Sie verschiedene Verteilungsdiagramme verwenden, darunter Histogramm-, KDE-, Box- und ECDF-Diagramme. Sie haben außerdem vier Möglichkeiten kennengelernt, ein ECDF-Diagramm mit demselben Datensatz darzustellen. Sie können je nach Wunsch jeden Ansatz verwenden.
Denken Sie immer daran, die notwendigen Bibliotheken für die Erstellung Ihres Plots mitzubringen und die richtige Funktion zu verwenden. Danach geht es nur noch darum, visuelle und stilistische Aspekte Ihres Plots wie die Achsenpositionierung und Farbtöne zu ändern.
Alles Gute,
Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.
Was ist Self in Python: Beispiele aus der Praxis
In diesem Tutorial zur DAX-Codierungssprache erfahren Sie, wie Sie die GENERATE-Funktion verwenden und einen Kennzahltitel dynamisch ändern.
In diesem Tutorial erfahren Sie, wie Sie mithilfe der Multi-Threaded-Dynamic-Visuals-Technik Erkenntnisse aus dynamischen Datenvisualisierungen in Ihren Berichten gewinnen.
In diesem Artikel werde ich den Filterkontext durchgehen. Der Filterkontext ist eines der Hauptthemen, über die sich jeder LuckyTemplates-Benutzer zunächst informieren sollte.
Ich möchte zeigen, wie der LuckyTemplates Apps-Onlinedienst bei der Verwaltung verschiedener Berichte und Erkenntnisse aus verschiedenen Quellen helfen kann.
Erfahren Sie, wie Sie Ihre Gewinnmargenänderungen mithilfe von Techniken wie Kennzahlenverzweigung und der Kombination von DAX-Formeln in LuckyTemplates ermitteln.
In diesem Tutorial werden die Ideen der Materialisierung von Datencaches und deren Auswirkungen auf die Leistung von DAXs bei der Bereitstellung von Ergebnissen erläutert.
Wenn Sie bisher noch Excel verwenden, ist dies der beste Zeitpunkt, LuckyTemplates für Ihre Geschäftsberichtsanforderungen zu verwenden.
Was ist LuckyTemplates Gateway? Alles was du wissen musst