So laden Sie Beispieldatensätze in Python

In diesem Beitrag schauen wir uns an, wie man Beispieldatensätze in Python lädt. Das scheint vielleicht nicht das glamouröseste Thema zu sein, aber es ist tatsächlich ziemlich wichtig. Idealerweise verfügen Sie über einige Datensätze in Python, mit denen Sie üben können, wenn Sie neue Konzepte erlernen. Das vollständige Video dieses Tutorials können Sie unten in diesem Blog ansehen.

Wenn Sie Ihren Code teilen , dokumentieren, was Sie getan haben , oder Hilfe benötigen , ist es wirklich eine gute Idee, einen allgemein verfügbaren Datensatz zu verwenden, um etwas zu erstellen, das als minimal reproduzierbares Beispiel bezeichnet wird .

Sie erhalten einen vorgefertigten Code oder ein Skript, das jemand anderes im Internet ausführen und Ihnen dabei helfen kann. Wenn Sie diese minimal reproduzierbaren Beispiele nicht erstellen , geraten Sie an Stellen wie Stack Overflow, was ein kleiner Schock sein kann, wenn Sie damit nicht vertraut sind.

So laden Sie Beispieldatensätze in Python

Schauen wir uns einige Möglichkeiten an, um diese minimal reproduzierbaren Beispiele zu erstellen und die Datensätze zu erhalten. Es gibt einige Pakete, mit denen Sie einen vorgefertigten Datensatz in Python laden und diesen Code weitergeben können.

Wir werden uns drei Pakete ansehen, die am häufigsten vorkommen. Lassen Sie uns ein leeres Jupyter-Notizbuch starten und loslegen.

So laden Sie Beispieldatensätze in Python

Inhaltsverzeichnis

Laden Sie Datensätze in Python von Sklearn
Laden Sie Datensätze in Python aus Vega-Datensätzen
Laden Sie Datensätze in Python von Seaborn
Abschluss

Laden Sie Datensätze in Python von Sklearn

Das erste, das wir uns ansehen werden, heißt Sklearn . Wenn Sie Anaconda verwenden, müssen Sie dies nicht herunterladen. Wenn Sie weitere Hilfe zu Python benötigen, bietet LuckyTemplates einen an , für den Sie sich anmelden können.

Ich gehe davon aus, dass Sie sich bereits mit Dingen wie Paketen auskennen, und gehe von dort aus weiter. Wir werden Pandas und Sklearn einbinden, insbesondere das Datensatz-Submodul.

So laden Sie Beispieldatensätze in Python

Wir werden einige dieser Datensätze mitbringen. Scikit-learn – eine Datenbibliothek für maschinelles Lernen – nennt sie Spielzeugdatensätze. Wir werden Boston laden, einen Datensatz zu Immobilienpreisen. Wenn wir dies einbringen, müssen wir es als Datenrahmen haben.

Wir müssen tatsächlich angeben, dass die Daten und Spalten aus dem Scikit-learn-Datensatz stammen, und die Feature-Variablen und die Zielvariablen trennen.

So laden Sie Beispieldatensätze in Python

Wir werden dies als Datenrahmen bereitstellen, damit wir damit arbeiten und verschiedene Dinge tun können. Panda ist ein großartiges Paket, das man als LuckyTemplates-Benutzer kennen sollte.

Laden Sie Datensätze in Python aus Vega-Datensätzen

Eine weitere Option, die wir lernen können, ist das Vega-Datasets-Paket. Dieses ist auf Anaconda nicht verfügbar, aber wir können es über PIP installieren. Dies ist, was wir in die Befehlszeile eingeben, um die Vega-Datensätze zu installieren und das lokale Datenmodul zu installieren oder zu importieren.

So laden Sie Beispieldatensätze in Python

Einige davon können Sie tatsächlich erhalten, Sie benötigen jedoch eine Internetverbindung. Wir bringen diejenigen ein, die lokal installiert sind, indem wir lokale Daten importieren und ausführen.

So laden Sie Beispieldatensätze in Python

Wie Sie sehen, gibt es eine ganze Reihe von Datensätzen. Bei einigen davon handelt es sich um Zeitreihen, bei anderen um kategoriale oder kontinuierliche Variablen. Wählen wir den Datensatz „Autos“ in einem Datenrahmen aus, damit wir die Head-Methode darauf ausführen können.

So laden Sie Beispieldatensätze in Python

Jetzt haben wir einen weiteren Beispieldatensatz, den wir verwenden und teilen können.

So laden Sie Beispieldatensätze in Python

Laden Sie Datensätze in Python von Seaborn

Seaborn ist ein weiteres Paket, das in der Anaconda-Distribution verfügbar ist. Seaborn ist standardmäßig vor allem für die Datenvisualisierung bekannt, verfügt aber auch über einige großartige Beispieldatensätze, die Sie verwenden können. Dies ist, was wir eingeben, um Datensätze zu erhalten.

So laden Sie Beispieldatensätze in Python

Wie Sie sehen, gibt es hier eine ganze Reihe von Datensätzen. Wir werden fortfahren und den Pinguin-Datensatz verwenden und die ersten paar Zeilen erneut abrufen.

So laden Sie Beispieldatensätze in Python

Das Ergebnis ist ein weiterer Datensatz, an dem wir üben können.

So laden Sie Beispieldatensätze in Python

Hier geht es nicht nur darum, Datensätze zum Üben zur Verfügung zu haben. Wenn wir fehlende Werte sehen, Probleme beim Löschen von Datensätzen haben, die kategoriale Variable ausfüllen möchten oder anderen Personen ein Beispiel zeigen möchten, ohne vertrauliche Daten anzugeben, können Sie einfach einen dieser öffentlich zugänglichen Datensätze verwenden, die wirklich sehr einfach sind damit Menschen es nutzen und teilen können. Das ist die Idee eines minimal reproduzierbaren Beispiels.

LuckyTemplates mit Python-Skripten zum Erstellen von Datumstabellen
Python in LuckyTemplates: So installieren und richten Sie
Python I für LuckyTemplates-Benutzer ein – Neuer Kurs in der LuckyTemplates Education Platform

Abschluss

Um es noch einmal zusammenzufassen: Es gibt drei Orte, an denen Sie nach Beispieldatensätzen suchen können. Scikit-learn ist ein Paket für maschinelles Lernen. Die Konvertierung ist etwas schwieriger, aber wenn Sie Dinge tun, die mit maschinellem Lernen zu tun haben, ist dies der richtige Ort. Vega-Datensätze verfügen auch über eine recht gute Anzahl von Datensätzen, insbesondere wenn Sie die Methode verwenden, um Datensätze aus dem Internet abzurufen. Das Laden ist jedoch relativ schwieriger, sodass Sie nur PIP verwenden müssen, anstatt es mit Anaconda vorinstalliert zu haben. Seaborn ist der Sweet Spot, weil es den Datenrahmen lädt und sehr vielseitig ist, wenn es um die Verwendung von Beispieldatensätzen und reproduzierbaren Beispielen geht.

Stack Overflow bietet auch ein Tutorial zum Schreiben eines guten, minimal reproduzierbaren Beispiels oder MRE. Schauen Sie sich das also an, wenn Sie etwas online veröffentlichen möchten.

Als Analyst ist es eine wirklich wichtige Fähigkeit, zu wissen, wo man gute Datensätze erhält und ein gutes MRE zu teilen.

Wenn Ihnen der Inhalt dieses speziellen Tutorials gefallen hat, abonnieren Sie bitte den LuckyTemplates-TV-Kanal. Wir veröffentlichen ständig eine große Menge an Inhalten von mir und einer Reihe von Inhaltserstellern – alle mit dem Ziel, die Art und Weise zu verbessern, wie Sie LuckyTemplates und die Power Platform nutzen.

Einen Kommentar hinterlassen

Streudiagramm-Visualisierungen mit Charticulator

In diesem Tutorial erfahren Sie, wie Sie mit Charticulator eine Streudiagramm-Visualisierung für Ihren LuckyTemplates-Bericht erstellen und entwerfen.

PowerApps-Suchfeld: So fügen Sie es hinzu und passen es an

Erfahren Sie, wie Sie ein PowerApps-Suchfeld von Grund auf erstellen und es an das Gesamtthema Ihrer App anpassen.

Power Automate String-Funktionen: Substring und IndexOf

Erlernen Sie ganz einfach zwei komplizierte Power Automate String-Funktionen, die in Microsoft Flows verwendet werden können – die Funktionen substring und indexOf.

Power Query M: Abwechselndes 0-1-Muster in der Datumstabelle

Dieses Tutorial konzentriert sich auf die Power Query M-Funktion „number.mod“, um ein abwechselndes 0-1-Muster in der Datumstabelle zu erstellen.

Prognosetechnik: Erkundung der Prognoselogik in LuckyTemplates-Modellen

In diesem Tutorial führe ich eine Prognosetechnik durch, bei der ich meine tatsächlichen Ergebnisse mit meinen Prognosen vergleiche und sie kumulativ betrachte.

Speichern Sie E-Mail-Anhänge in SharePoint mit Power Automate

In diesem Blog erfahren Sie, wie Sie mit Power Automate E-Mail-Anhänge automatisch in SharePoint speichern und E-Mails anschließend löschen.

Führen Sie eine Bis-Loop-Steuerung in Power Automate durch

Erfahren Sie, wie die Do Until Schleifensteuerung in Power Automate funktioniert und welche Schritte zur Implementierung erforderlich sind.

Berechnen eines gleitenden Durchschnitts in LuckyTemplates mithilfe von DAX

In diesem Tutorial erfahren Sie, wie Sie mithilfe der ALLSELECTED-Funktion einen dynamischen gleitenden Durchschnitt in LuckyTemplates berechnen können.

Berechnen Sie dynamisch eine laufende oder kumulative LuckyTemplates-Summe

Durch diesen Artikel erhalten wir ein klares und besseres Verständnis für die dynamische Berechnung einer laufenden oder kumulativen Gesamtsumme in LuckyTemplates.

Power Automate auf jede Aktion in Workflows anwenden

Erfahren und verstehen Sie die Bedeutung und ordnungsgemäße Verwendung der Power Automate-Aktionssteuerung „Auf jede anwenden“ in unseren Microsoft-Workflows.