So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

In diesem Blog wird die Verwendung eines kumulativen Verteilungsdiagramms , auch bekannt als empirische kumulative Verteilungsfunktion oder ECDF-Diagramme, demonstriert und die Vorteile der Verwendung dieser Diagrammvariation gegenüber anderen Diagrammtypen aufgezeigt. Das vollständige Video dieses Tutorials können Sie unten in diesem Blog ansehen .

Die meisten Menschen bevorzugen ECDF-Diagramme gegenüber , um die Daten zu visualisieren, da sie jeden Datenpunkt direkt darstellen. Diese Funktion erleichtert dem Benutzer die Interaktion mit dem Diagramm. Heute erfahren Sie, wie Sie ein ECDF in Python und LuckyTemplates verwenden und Ihre Präsentationen und Berichte zur Datenverteilung verbessern.

Inhaltsverzeichnis

Arten von Verteilungsgrundstücken

Ich beginne damit, meine Daten an einem bestimmten Tag, Samstag, zu filtern. Unten sehen wir alle diese Python-Diagramme, die zur Beschreibung von Verteilungen verwendet werden. Wir haben hier unseren ECDF-Plot, ein Histogramm, einen KDE-Plot und einen Box-Plot.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Alle diese Diagramme beschreiben, wie Daten verteilt oder verteilt werden. Wenn wir beispielsweise nach unten gehen und uns das Histogramm ansehen, können wir erkennen, dass sich unsere Daten in den meisten dieser hohen Behälter befinden.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Mit rund 3,50 $ haben wir in unserem Datensatz unten den höchsten Wert für unsere Tipps- Daten.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Wir können auch einen KDE-Plot verwenden, der uns bei der Betrachtung der Verteilung eine andere Metrik liefert. Das Histogramm befasst sich mit der Anzahl, die sich in diesen Behältern befindet, während KDE sich mit der Dichte befasst.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Mit einem KDE-Diagramm können Sie erkennen, wo sich die meisten unserer Daten befinden, indem Sie die größte Dichte oder, wenn Sie so wollen, die höchste Ausbuchtung im Diagramm erkennen. Im Bild oben können wir also sagen, dass die Verteilung irgendwo zwischen 2 und 4 US-Dollar liegt.

Das Gleiche gilt für ein Boxdiagramm, das zeigt, dass die Verteilung 2 bis 4 US-Dollar beträgt, und dort werden sich die meisten unserer Daten befinden. Es verwendet einen Median, die horizontale Linie, die das Feld teilt, um uns eine Vorstellung davon zu geben, wo die größte Verteilung besteht.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Und dann haben wir das ECDF-Diagramm, in dem Sie auf der linken Seite der Y-Achse das Wort Proportion sehen können , das unsere Perzentile darstellt. Basierend auf dem Diagramm betrachten wir bei 3,50 $ etwa 50 % unserer Daten, und bei 5 $ und darunter sind 80 % unserer Daten verteilt.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Histogramm-Plotcode

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Jetzt zeige ich Ihnen den Code für jedes dieser Diagramme, beginnend mit dem Histogramm. Sie verfügen alle über eine sehr ähnliche und wiederholbare Codierung , sodass Sie sie schnell mithilfe eines Codes wie einer Vorlage abrufen können.

Wir müssen zuerst  Seaborn importieren  und als sb speichern  gefolgt von  matplotlib.pyplot  als  plt. Wir verwenden einen Hintergrundstil namens  ggplot  und diese  Matplotlib-  Variable, um verschiedene Stile zu übergeben.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Im Bild unten sehen wir beispielsweise, dass wir in der 11. Zeile einen Titel für das Histogramm und die Teilstrichgrößen in den folgenden Zeilen hinzufügen. Die  Yticks  und  Xticks  repräsentieren entsprechend die x- und y-Größen.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

In der 14. Zeile verwenden wir eine Seaborn-Variable, um die Funktion zu übergeben , die diesen bestimmten Plot einbringt, wie den  Histoplot  im obigen Beispiel, der einen Histogrammplot darstellt. Anschließend übergeben wir die Daten aus der 4. Zeile als Datensatz an die Funktion.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Alles, was Sie in die Werte einfügen, stellt Ihren Datensatz dar und löscht die Duplikate. Dann verwenden wir  für die Spitzen und  einen  Farbton,  der es Ihnen zusammen  mit seaborn ermöglicht, Ihre Daten nach Kategorien zu unterteilen. Wenn wir zu unserem Bild zurückkehren, können wir feststellen, dass es Kategorien hat, darunter „The“, „Time“ oder „Raucher“.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

KDE-Plot

Beim KDE-Plot ist alles nahezu identisch. Wir müssen nur einen neuen Parameter namens „Shade“ übergeben, um dieses schattierte Aussehen zu erhalten. Ansonsten sind der Farbton, die Daten und der Rest gleich.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Der Box-Plot ähnelt bis auf ein paar kleinere Unterschiede größtenteils anderen Plots. Hier verwenden wir die  Boxplot-Funktion  , wobei  x  der Tag und  y  die Tipps sind. Wir verwenden für diesen Plot auch keinen  Farbton  .

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Es ist also die gleiche Struktur wie das ECDF-Diagramm und der einzige Unterschied besteht in der Seaborn-Variablen, wo wir ein ECDF-Diagramm übergeben und den Farbton als Tag verwenden. Wir können diesen Farbton aber auch in eine andere Kategorie ändern, beispielsweise „Raucher“.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Wenn wir diese Kategorie übergeben, erhalten wir ein ECDF-Diagramm mit zwei verschiedenen Linien. In diesen Verteilungen können wir sehen, dass die Raucher mehr über unsere spezielle Linienbreite wissen.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Bei Nichtrauchern liegt dieser Wert zu hundert Prozent unter 6 US-Dollar, bei Rauchern bei 6 US-Dollar. Interessanterweise geben unsere Raucher an einem bestimmten Tag möglicherweise ein größeres Trinkgeld.

Styling von ECDF-Plots

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Jetzt können wir unsere ECDF-Plots weiter gestalten, um sie ansehnlicher zu machen. Im Bild unten sind verschiedene ECDF-Diagramme zu sehen. Im ersten Plot habe ich die Linien größer gemacht und eine andere Farbpalette verwendet.

Im ersten Plot habe ich verschiedene Parameter innerhalb der Funktion verwendet. Wie Sie unten sehen können, habe ich die Palette als  Sommer  und die Linienstärke als  5 übergeben. 

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Ich habe auch Samstag und Sonntag verglichen, weshalb es zwei verschiedene grüne Linien gibt. Hier sehen wir, dass das Trinkgeld von 3 $ für Sonntag beim 45. Perzentil und für Donnerstag beim 70. Perzentil liegt, was uns zeigt, dass die Leute dazu neigen, am Sonntag höhere Trinkgelder zu geben.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Wir können auch die X- und Y-Achse vertauschen, die Proportionen und die Spitze innerhalb unseres Plots vertauschen und die Palette ändern, genau wie im Bild unten.

Hier können wir sehen, dass das Trinkgeld von 2 $ für Sonntag beim 20. Perzentil liegt, was der violetten Linie im Diagramm entspricht. Die Daten stimmen also mit denen des vorherigen ECDF-Diagramms überein und nur die Darstellung unterscheidet sich.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Wir haben jetzt ein weiteres Diagramm mit demselben Datensatz und behalten die ursprünglichen Achsenpositionen bei, wie im Bild oben gezeigt. Der Unterschied besteht dieses Mal darin, dass die Richtung der Linien umgekehrt ist.

ECDF-Diagrammstil

Wenn wir uns den Code ansehen, übergeben wir lediglich den Parameter  „complementary equal = true“. Mit dieser Aktion  können wir sagen, dass im Bereich von 2 $ und darüber 80 % unserer Daten verteilt sind, anstatt zu sagen, dass unterhalb des 2-Dollar-Bereichs 20 % unserer Daten verteilt sind. Auch hier handelt es sich um dieselben Daten mit einem anderen Aussehen oder einer anderen Darstellungsweise.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Und in unserem vierten und letzten ECDF-Diagramm verwenden wir Count statt Proportion.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Dieser Ansatz ist hilfreich, wenn wir mehr als ein paar Grundstücke haben. Wenn wir uns die Zählspalte im Bild unten ansehen, können wir sehen, dass es am Freitag nicht viele Beobachtungen gibt, was uns sagt, dass die Leute an diesem Tag nicht viele Trinkgelder hinterlassen.

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

ECDF stellt Code-Grundlagen dar

Wenn wir uns den Code ansehen, finden Sie  Seaborn , das die Hauptsache für die Erstellung dieser speziellen Handlung ist. Wir haben auch  matplotlib.pyplot  für das Styling, das Sie als Variable namens  plt speichern können .

So verwenden Sie ECDF-Diagramme in Python und LuckyTemplates

Mithilfe dieser Variablen können wir dann verschiedene Stile für unseren jeweiligen Plot erstellen, beispielsweise Titel und Schriftgrößen hinzufügen. Der Hauptteil Ihres Codes wird Ihre ECDF-Plotfunktion sein, die wir mit Seaborn einbinden.


Streudiagramm in R-Skript: So erstellen und importieren Sie
benutzerdefinierte Python-Funktionen | Ein Überblick
über GGPLOT2 in R: Visualisierungen mit ESQUISSE

Abschluss

Auf diese Weise können Sie verschiedene Verteilungsdiagramme verwenden, darunter Histogramm-, KDE-, Box- und ECDF-Diagramme. Sie haben außerdem vier Möglichkeiten kennengelernt, ein ECDF-Diagramm mit demselben Datensatz darzustellen. Sie können je nach Wunsch jeden Ansatz verwenden.

Denken Sie immer daran, die notwendigen Bibliotheken für die Erstellung Ihres Plots mitzubringen und die richtige Funktion zu verwenden. Danach geht es nur noch darum, visuelle und stilistische Aspekte Ihres Plots wie die Achsenpositionierung und Farbtöne zu ändern.

Alles Gute,


So speichern und laden Sie eine RDS-Datei in R

So speichern und laden Sie eine RDS-Datei in R

Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.

Was ist Self in Python: Beispiele aus der Praxis

Was ist Self in Python: Beispiele aus der Praxis

Was ist Self in Python: Beispiele aus der Praxis

First N Business Days Revisited – Eine DAX-Codierungssprachenlösung

First N Business Days Revisited – Eine DAX-Codierungssprachenlösung

In diesem Tutorial zur DAX-Codierungssprache erfahren Sie, wie Sie die GENERATE-Funktion verwenden und einen Kennzahltitel dynamisch ändern.

Präsentieren Sie Einblicke mithilfe der Multi-Threaded-Dynamic-Visuals-Technik in LuckyTemplates

Präsentieren Sie Einblicke mithilfe der Multi-Threaded-Dynamic-Visuals-Technik in LuckyTemplates

In diesem Tutorial erfahren Sie, wie Sie mithilfe der Multi-Threaded-Dynamic-Visuals-Technik Erkenntnisse aus dynamischen Datenvisualisierungen in Ihren Berichten gewinnen.

Einführung in den Filterkontext in LuckyTemplates

Einführung in den Filterkontext in LuckyTemplates

In diesem Artikel werde ich den Filterkontext durchgehen. Der Filterkontext ist eines der Hauptthemen, über die sich jeder LuckyTemplates-Benutzer zunächst informieren sollte.

Beste Tipps zur Verwendung der Apps im LuckyTemplates-Onlinedienst

Beste Tipps zur Verwendung der Apps im LuckyTemplates-Onlinedienst

Ich möchte zeigen, wie der LuckyTemplates Apps-Onlinedienst bei der Verwaltung verschiedener Berichte und Erkenntnisse aus verschiedenen Quellen helfen kann.

Analysieren Sie Gewinnmargenänderungen im Laufe der Zeit – Analysen mit LuckyTemplates und DAX

Analysieren Sie Gewinnmargenänderungen im Laufe der Zeit – Analysen mit LuckyTemplates und DAX

Erfahren Sie, wie Sie Ihre Gewinnmargenänderungen mithilfe von Techniken wie Kennzahlenverzweigung und der Kombination von DAX-Formeln in LuckyTemplates ermitteln.

Materialisierungsideen für Datencaches in DAX Studio

Materialisierungsideen für Datencaches in DAX Studio

In diesem Tutorial werden die Ideen der Materialisierung von Datencaches und deren Auswirkungen auf die Leistung von DAXs bei der Bereitstellung von Ergebnissen erläutert.

Geschäftsberichte mit LuckyTemplates

Geschäftsberichte mit LuckyTemplates

Wenn Sie bisher noch Excel verwenden, ist dies der beste Zeitpunkt, LuckyTemplates für Ihre Geschäftsberichtsanforderungen zu verwenden.

Was ist LuckyTemplates Gateway? Alles was du wissen musst

Was ist LuckyTemplates Gateway? Alles was du wissen musst

Was ist LuckyTemplates Gateway? Alles was du wissen musst