Streudiagramm-Visualisierungen mit Charticulator
In diesem Tutorial erfahren Sie, wie Sie mit Charticulator eine Streudiagramm-Visualisierung für Ihren LuckyTemplates-Bericht erstellen und entwerfen.
In diesem Beitrag schauen wir uns an, wie man Beispieldatensätze in Python lädt. Das scheint vielleicht nicht das glamouröseste Thema zu sein, aber es ist tatsächlich ziemlich wichtig. Idealerweise verfügen Sie über einige Datensätze in Python, mit denen Sie üben können, wenn Sie neue Konzepte erlernen. Das vollständige Video dieses Tutorials können Sie unten in diesem Blog ansehen.
Wenn Sie Ihren Code teilen , dokumentieren, was Sie getan haben , oder Hilfe benötigen , ist es wirklich eine gute Idee, einen allgemein verfügbaren Datensatz zu verwenden, um etwas zu erstellen, das als minimal reproduzierbares Beispiel bezeichnet wird .
Sie erhalten einen vorgefertigten Code oder ein Skript, das jemand anderes im Internet ausführen und Ihnen dabei helfen kann. Wenn Sie diese minimal reproduzierbaren Beispiele nicht erstellen , geraten Sie an Stellen wie Stack Overflow, was ein kleiner Schock sein kann, wenn Sie damit nicht vertraut sind.
Schauen wir uns einige Möglichkeiten an, um diese minimal reproduzierbaren Beispiele zu erstellen und die Datensätze zu erhalten. Es gibt einige Pakete, mit denen Sie einen vorgefertigten Datensatz in Python laden und diesen Code weitergeben können.
Wir werden uns drei Pakete ansehen, die am häufigsten vorkommen. Lassen Sie uns ein leeres Jupyter-Notizbuch starten und loslegen.
Inhaltsverzeichnis
Laden Sie Datensätze in Python von Sklearn
Das erste, das wir uns ansehen werden, heißt Sklearn . Wenn Sie Anaconda verwenden, müssen Sie dies nicht herunterladen. Wenn Sie weitere Hilfe zu Python benötigen, bietet LuckyTemplates einen an , für den Sie sich anmelden können.
Ich gehe davon aus, dass Sie sich bereits mit Dingen wie Paketen auskennen, und gehe von dort aus weiter. Wir werden Pandas und Sklearn einbinden, insbesondere das Datensatz-Submodul.
Wir werden einige dieser Datensätze mitbringen. Scikit-learn – eine Datenbibliothek für maschinelles Lernen – nennt sie Spielzeugdatensätze. Wir werden Boston laden, einen Datensatz zu Immobilienpreisen. Wenn wir dies einbringen, müssen wir es als Datenrahmen haben.
Wir müssen tatsächlich angeben, dass die Daten und Spalten aus dem Scikit-learn-Datensatz stammen, und die Feature-Variablen und die Zielvariablen trennen.
Wir werden dies als Datenrahmen bereitstellen, damit wir damit arbeiten und verschiedene Dinge tun können. Panda ist ein großartiges Paket, das man als LuckyTemplates-Benutzer kennen sollte.
Laden Sie Datensätze in Python aus Vega-Datensätzen
Eine weitere Option, die wir lernen können, ist das Vega-Datasets-Paket. Dieses ist auf Anaconda nicht verfügbar, aber wir können es über PIP installieren. Dies ist, was wir in die Befehlszeile eingeben, um die Vega-Datensätze zu installieren und das lokale Datenmodul zu installieren oder zu importieren.
Einige davon können Sie tatsächlich erhalten, Sie benötigen jedoch eine Internetverbindung. Wir bringen diejenigen ein, die lokal installiert sind, indem wir lokale Daten importieren und ausführen.
Wie Sie sehen, gibt es eine ganze Reihe von Datensätzen. Bei einigen davon handelt es sich um Zeitreihen, bei anderen um kategoriale oder kontinuierliche Variablen. Wählen wir den Datensatz „Autos“ in einem Datenrahmen aus, damit wir die Head-Methode darauf ausführen können.
Jetzt haben wir einen weiteren Beispieldatensatz, den wir verwenden und teilen können.
Laden Sie Datensätze in Python von Seaborn
Seaborn ist ein weiteres Paket, das in der Anaconda-Distribution verfügbar ist. Seaborn ist standardmäßig vor allem für die Datenvisualisierung bekannt, verfügt aber auch über einige großartige Beispieldatensätze, die Sie verwenden können. Dies ist, was wir eingeben, um Datensätze zu erhalten.
Wie Sie sehen, gibt es hier eine ganze Reihe von Datensätzen. Wir werden fortfahren und den Pinguin-Datensatz verwenden und die ersten paar Zeilen erneut abrufen.
Das Ergebnis ist ein weiterer Datensatz, an dem wir üben können.
Hier geht es nicht nur darum, Datensätze zum Üben zur Verfügung zu haben. Wenn wir fehlende Werte sehen, Probleme beim Löschen von Datensätzen haben, die kategoriale Variable ausfüllen möchten oder anderen Personen ein Beispiel zeigen möchten, ohne vertrauliche Daten anzugeben, können Sie einfach einen dieser öffentlich zugänglichen Datensätze verwenden, die wirklich sehr einfach sind damit Menschen es nutzen und teilen können. Das ist die Idee eines minimal reproduzierbaren Beispiels.
LuckyTemplates mit Python-Skripten zum Erstellen von Datumstabellen
Python in LuckyTemplates: So installieren und richten Sie
Python I für LuckyTemplates-Benutzer ein – Neuer Kurs in der LuckyTemplates Education Platform
Abschluss
Um es noch einmal zusammenzufassen: Es gibt drei Orte, an denen Sie nach Beispieldatensätzen suchen können. Scikit-learn ist ein Paket für maschinelles Lernen. Die Konvertierung ist etwas schwieriger, aber wenn Sie Dinge tun, die mit maschinellem Lernen zu tun haben, ist dies der richtige Ort. Vega-Datensätze verfügen auch über eine recht gute Anzahl von Datensätzen, insbesondere wenn Sie die Methode verwenden, um Datensätze aus dem Internet abzurufen. Das Laden ist jedoch relativ schwieriger, sodass Sie nur PIP verwenden müssen, anstatt es mit Anaconda vorinstalliert zu haben. Seaborn ist der Sweet Spot, weil es den Datenrahmen lädt und sehr vielseitig ist, wenn es um die Verwendung von Beispieldatensätzen und reproduzierbaren Beispielen geht.
Stack Overflow bietet auch ein Tutorial zum Schreiben eines guten, minimal reproduzierbaren Beispiels oder MRE. Schauen Sie sich das also an, wenn Sie etwas online veröffentlichen möchten.
Als Analyst ist es eine wirklich wichtige Fähigkeit, zu wissen, wo man gute Datensätze erhält und ein gutes MRE zu teilen.
Wenn Ihnen der Inhalt dieses speziellen Tutorials gefallen hat, abonnieren Sie bitte den LuckyTemplates-TV-Kanal. Wir veröffentlichen ständig eine große Menge an Inhalten von mir und einer Reihe von Inhaltserstellern – alle mit dem Ziel, die Art und Weise zu verbessern, wie Sie LuckyTemplates und die Power Platform nutzen.
In diesem Tutorial erfahren Sie, wie Sie mit Charticulator eine Streudiagramm-Visualisierung für Ihren LuckyTemplates-Bericht erstellen und entwerfen.
Erfahren Sie, wie Sie ein PowerApps-Suchfeld von Grund auf erstellen und es an das Gesamtthema Ihrer App anpassen.
Erlernen Sie ganz einfach zwei komplizierte Power Automate String-Funktionen, die in Microsoft Flows verwendet werden können – die Funktionen substring und indexOf.
Dieses Tutorial konzentriert sich auf die Power Query M-Funktion „number.mod“, um ein abwechselndes 0-1-Muster in der Datumstabelle zu erstellen.
In diesem Tutorial führe ich eine Prognosetechnik durch, bei der ich meine tatsächlichen Ergebnisse mit meinen Prognosen vergleiche und sie kumulativ betrachte.
In diesem Blog erfahren Sie, wie Sie mit Power Automate E-Mail-Anhänge automatisch in SharePoint speichern und E-Mails anschließend löschen.
Erfahren Sie, wie die Do Until Schleifensteuerung in Power Automate funktioniert und welche Schritte zur Implementierung erforderlich sind.
In diesem Tutorial erfahren Sie, wie Sie mithilfe der ALLSELECTED-Funktion einen dynamischen gleitenden Durchschnitt in LuckyTemplates berechnen können.
Durch diesen Artikel erhalten wir ein klares und besseres Verständnis für die dynamische Berechnung einer laufenden oder kumulativen Gesamtsumme in LuckyTemplates.
Erfahren und verstehen Sie die Bedeutung und ordnungsgemäße Verwendung der Power Automate-Aktionssteuerung „Auf jede anwenden“ in unseren Microsoft-Workflows.