So speichern und laden Sie eine RDS-Datei in R
Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.
In diesem Beitrag schauen wir uns an, wie man Beispieldatensätze in Python lädt. Das scheint vielleicht nicht das glamouröseste Thema zu sein, aber es ist tatsächlich ziemlich wichtig. Idealerweise verfügen Sie über einige Datensätze in Python, mit denen Sie üben können, wenn Sie neue Konzepte erlernen. Das vollständige Video dieses Tutorials können Sie unten in diesem Blog ansehen.
Wenn Sie Ihren Code teilen , dokumentieren, was Sie getan haben , oder Hilfe benötigen , ist es wirklich eine gute Idee, einen allgemein verfügbaren Datensatz zu verwenden, um etwas zu erstellen, das als minimal reproduzierbares Beispiel bezeichnet wird .
Sie erhalten einen vorgefertigten Code oder ein Skript, das jemand anderes im Internet ausführen und Ihnen dabei helfen kann. Wenn Sie diese minimal reproduzierbaren Beispiele nicht erstellen , geraten Sie an Stellen wie Stack Overflow, was ein kleiner Schock sein kann, wenn Sie damit nicht vertraut sind.
Schauen wir uns einige Möglichkeiten an, um diese minimal reproduzierbaren Beispiele zu erstellen und die Datensätze zu erhalten. Es gibt einige Pakete, mit denen Sie einen vorgefertigten Datensatz in Python laden und diesen Code weitergeben können.
Wir werden uns drei Pakete ansehen, die am häufigsten vorkommen. Lassen Sie uns ein leeres Jupyter-Notizbuch starten und loslegen.
Inhaltsverzeichnis
Laden Sie Datensätze in Python von Sklearn
Das erste, das wir uns ansehen werden, heißt Sklearn . Wenn Sie Anaconda verwenden, müssen Sie dies nicht herunterladen. Wenn Sie weitere Hilfe zu Python benötigen, bietet LuckyTemplates einen an , für den Sie sich anmelden können.
Ich gehe davon aus, dass Sie sich bereits mit Dingen wie Paketen auskennen, und gehe von dort aus weiter. Wir werden Pandas und Sklearn einbinden, insbesondere das Datensatz-Submodul.
Wir werden einige dieser Datensätze mitbringen. Scikit-learn – eine Datenbibliothek für maschinelles Lernen – nennt sie Spielzeugdatensätze. Wir werden Boston laden, einen Datensatz zu Immobilienpreisen. Wenn wir dies einbringen, müssen wir es als Datenrahmen haben.
Wir müssen tatsächlich angeben, dass die Daten und Spalten aus dem Scikit-learn-Datensatz stammen, und die Feature-Variablen und die Zielvariablen trennen.
Wir werden dies als Datenrahmen bereitstellen, damit wir damit arbeiten und verschiedene Dinge tun können. Panda ist ein großartiges Paket, das man als LuckyTemplates-Benutzer kennen sollte.
Laden Sie Datensätze in Python aus Vega-Datensätzen
Eine weitere Option, die wir lernen können, ist das Vega-Datasets-Paket. Dieses ist auf Anaconda nicht verfügbar, aber wir können es über PIP installieren. Dies ist, was wir in die Befehlszeile eingeben, um die Vega-Datensätze zu installieren und das lokale Datenmodul zu installieren oder zu importieren.
Einige davon können Sie tatsächlich erhalten, Sie benötigen jedoch eine Internetverbindung. Wir bringen diejenigen ein, die lokal installiert sind, indem wir lokale Daten importieren und ausführen.
Wie Sie sehen, gibt es eine ganze Reihe von Datensätzen. Bei einigen davon handelt es sich um Zeitreihen, bei anderen um kategoriale oder kontinuierliche Variablen. Wählen wir den Datensatz „Autos“ in einem Datenrahmen aus, damit wir die Head-Methode darauf ausführen können.
Jetzt haben wir einen weiteren Beispieldatensatz, den wir verwenden und teilen können.
Laden Sie Datensätze in Python von Seaborn
Seaborn ist ein weiteres Paket, das in der Anaconda-Distribution verfügbar ist. Seaborn ist standardmäßig vor allem für die Datenvisualisierung bekannt, verfügt aber auch über einige großartige Beispieldatensätze, die Sie verwenden können. Dies ist, was wir eingeben, um Datensätze zu erhalten.
Wie Sie sehen, gibt es hier eine ganze Reihe von Datensätzen. Wir werden fortfahren und den Pinguin-Datensatz verwenden und die ersten paar Zeilen erneut abrufen.
Das Ergebnis ist ein weiterer Datensatz, an dem wir üben können.
Hier geht es nicht nur darum, Datensätze zum Üben zur Verfügung zu haben. Wenn wir fehlende Werte sehen, Probleme beim Löschen von Datensätzen haben, die kategoriale Variable ausfüllen möchten oder anderen Personen ein Beispiel zeigen möchten, ohne vertrauliche Daten anzugeben, können Sie einfach einen dieser öffentlich zugänglichen Datensätze verwenden, die wirklich sehr einfach sind damit Menschen es nutzen und teilen können. Das ist die Idee eines minimal reproduzierbaren Beispiels.
LuckyTemplates mit Python-Skripten zum Erstellen von Datumstabellen
Python in LuckyTemplates: So installieren und richten Sie
Python I für LuckyTemplates-Benutzer ein – Neuer Kurs in der LuckyTemplates Education Platform
Abschluss
Um es noch einmal zusammenzufassen: Es gibt drei Orte, an denen Sie nach Beispieldatensätzen suchen können. Scikit-learn ist ein Paket für maschinelles Lernen. Die Konvertierung ist etwas schwieriger, aber wenn Sie Dinge tun, die mit maschinellem Lernen zu tun haben, ist dies der richtige Ort. Vega-Datensätze verfügen auch über eine recht gute Anzahl von Datensätzen, insbesondere wenn Sie die Methode verwenden, um Datensätze aus dem Internet abzurufen. Das Laden ist jedoch relativ schwieriger, sodass Sie nur PIP verwenden müssen, anstatt es mit Anaconda vorinstalliert zu haben. Seaborn ist der Sweet Spot, weil es den Datenrahmen lädt und sehr vielseitig ist, wenn es um die Verwendung von Beispieldatensätzen und reproduzierbaren Beispielen geht.
Stack Overflow bietet auch ein Tutorial zum Schreiben eines guten, minimal reproduzierbaren Beispiels oder MRE. Schauen Sie sich das also an, wenn Sie etwas online veröffentlichen möchten.
Als Analyst ist es eine wirklich wichtige Fähigkeit, zu wissen, wo man gute Datensätze erhält und ein gutes MRE zu teilen.
Wenn Ihnen der Inhalt dieses speziellen Tutorials gefallen hat, abonnieren Sie bitte den LuckyTemplates-TV-Kanal. Wir veröffentlichen ständig eine große Menge an Inhalten von mir und einer Reihe von Inhaltserstellern – alle mit dem Ziel, die Art und Weise zu verbessern, wie Sie LuckyTemplates und die Power Platform nutzen.
Sie erfahren, wie Sie Objekte aus einer .rds-Datei in R speichern und laden. In diesem Blog wird auch behandelt, wie Sie Objekte aus R in LuckyTemplates importieren.
Was ist Self in Python: Beispiele aus der Praxis
In diesem Tutorial zur DAX-Codierungssprache erfahren Sie, wie Sie die GENERATE-Funktion verwenden und einen Kennzahltitel dynamisch ändern.
In diesem Tutorial erfahren Sie, wie Sie mithilfe der Multi-Threaded-Dynamic-Visuals-Technik Erkenntnisse aus dynamischen Datenvisualisierungen in Ihren Berichten gewinnen.
In diesem Artikel werde ich den Filterkontext durchgehen. Der Filterkontext ist eines der Hauptthemen, über die sich jeder LuckyTemplates-Benutzer zunächst informieren sollte.
Ich möchte zeigen, wie der LuckyTemplates Apps-Onlinedienst bei der Verwaltung verschiedener Berichte und Erkenntnisse aus verschiedenen Quellen helfen kann.
Erfahren Sie, wie Sie Ihre Gewinnmargenänderungen mithilfe von Techniken wie Kennzahlenverzweigung und der Kombination von DAX-Formeln in LuckyTemplates ermitteln.
In diesem Tutorial werden die Ideen der Materialisierung von Datencaches und deren Auswirkungen auf die Leistung von DAXs bei der Bereitstellung von Ergebnissen erläutert.
Wenn Sie bisher noch Excel verwenden, ist dies der beste Zeitpunkt, LuckyTemplates für Ihre Geschäftsberichtsanforderungen zu verwenden.
Was ist LuckyTemplates Gateway? Alles was du wissen musst