Streudiagramm-Visualisierungen mit Charticulator
In diesem Tutorial erfahren Sie, wie Sie mit Charticulator eine Streudiagramm-Visualisierung für Ihren LuckyTemplates-Bericht erstellen und entwerfen.
Durch die Optimierung von R-Code kann die Leistung von R-Skripten und -Programmen erheblich verbessert werden, sodass diese effizienter ausgeführt werden. Dies ist besonders wichtig für große und komplexe Datensätze sowie für Anwendungen, die in Echtzeit oder regelmäßig ausgeführt werden müssen.
In diesem Tutorial bewerten und optimieren wir die Leistung eines R-Codes mithilfe verschiedener R-Pakete wie Tidyverse und Data.table. Als Beispiel sehen wir, wie lange es dauert, bis RStudio eine große CSV-Datei mit der Funktion read.csv() , dem Tidyverse-Paket und dem Data.table-Paket liest .
Inhaltsverzeichnis
Optimierung der Leistung in R
Öffnen Sie RStudio. Weisen Sie im R-Skript die Dateierweiterung einer Variablen zu.
Sie müssen die Funktion system.file() verwenden , um zu bestimmen, wie lange die Ausführung einer Funktion oder Operation dauert. Da wir auswerten möchten, wie lange es dauert, eine Datei zu öffnen, schreiben Sie read.csv (df) in das Argument.
Wenn Sie den Code ausführen, zeigt Ihnen die Konsole an, wie lange es gedauert hat, die Datei zu öffnen. Die Spalte „Verstrichen“ zeigt, wie lange es gedauert hat, bis die CPU den R-Code ausgeführt hat. Die Ergebnisse zeigen, dass RStudio 31,93 Sekunden benötigte, was eine beträchtliche Zeitspanne darstellt. Diese Ladezeit ist unpraktisch, wenn Sie ständig mit großen Datensätzen arbeiten.
Eine Möglichkeit, die Leistung Ihres R-Codes zu optimieren, ist die Verwendung des Tidyverse- Pakets. Dadurch verkürzt sich die Zeit von 30 auf 5 Sekunden.
Beachten Sie, dass Sie zum Lesen der Datei die Funktion read_csv() verwenden müssen .
Das Paket „Tidyverse“ verbessert die Ladezeit in R durch die Verwendung des Pakets „readr “, das eine Reihe schneller und effizienter Funktionen zum Lesen und Schreiben von Daten bereitstellt. Das Paket readr bietet Funktionen wie read_csv() und read_table() , mit denen große Datenmengen schnell und effizient gelesen werden können.
Eine weitere Optimierungsmethode in R ist die Verwendung des data.table- Pakets. Dieser kann kostenlos im Internet heruntergeladen werden.
Das data.table-Paket in R ist ein leistungsstarkes und effizientes Tool für die Arbeit mit großen und komplexen Datensätzen. Es bietet eine erweiterte Version des data.frame-Objekts, einer Kerndatenstruktur in R. Der Hauptvorteil von data.table ist seine hohe Leistung und geringe Speichernutzung bei der Arbeit mit großen Datensätzen.
Beachten Sie, dass Sie bei Verwendung dieses Pakets die Funktion fread() anstelle von read.csv() schreiben müssen . Wenn Sie dies zusammen mit Ihrem Code ausführen, können Sie feststellen, dass sich die Ladezeit auf 2,25 Sekunden verkürzt.
Vergleichen von R-Paketen mithilfe von Microbenchmark
Um die Leistung der einzelnen Methoden zu vergleichen, können Sie die Funktion microbenchmark ( ) verwenden .
Die Microbenchmark()-Funktion in R ist ein Werkzeug zum Messen der Leistung von R-Code. Es bietet eine einfache und benutzerfreundliche Schnittstelle zum Benchmarking der Ausführungszeit von R-Ausdrücken.
Das Tolle an dieser Funktion ist, dass Sie festlegen können, wie oft der Vorgang wiederholt wird. Dies führt zu genaueren Ergebnissen. Sie können auch feststellen, ob die Ergebnisse konsistent sind.
Wenn Sie Probleme beim Lesen einer CSV-Datei in LuckyTemplates haben, kann RStudio dies für Sie erledigen. In R gibt es weitere Optionen, mit denen Sie die Leistung Ihres Codes optimieren können. Aufgrund seiner Einfachheit ist data.table jedoch sehr zu empfehlen.
Abschluss
Die Optimierung des R-Codes ist ein wichtiger Schritt, um sicherzustellen, dass Ihre R-Skripte effizient ausgeführt werden. Es gibt verschiedene Techniken und Tools, die zur Optimierung von R-Code verwendet werden können, z. B. die Verwendung des Tidyverse-Pakets zur Datenbearbeitung, die Verwendung des data.table-Pakets für große Datensätze und die Verwendung des Microbenchmark-Pakets zur Messung der Leistung von R-Code.
Es ist auch wichtig, gute Codierungspraktiken im Auge zu behalten, z. B. die Verwendung vektorisierter Operationen anstelle von Schleifen, die Verwendung integrierter Funktionen anstelle des Schreibens eigener Funktionen und die Berücksichtigung der Speichernutzung Ihres Codes.
Alles Gute,
George Mount
In diesem Tutorial erfahren Sie, wie Sie mit Charticulator eine Streudiagramm-Visualisierung für Ihren LuckyTemplates-Bericht erstellen und entwerfen.
Erfahren Sie, wie Sie ein PowerApps-Suchfeld von Grund auf erstellen und es an das Gesamtthema Ihrer App anpassen.
Erlernen Sie ganz einfach zwei komplizierte Power Automate String-Funktionen, die in Microsoft Flows verwendet werden können – die Funktionen substring und indexOf.
Dieses Tutorial konzentriert sich auf die Power Query M-Funktion „number.mod“, um ein abwechselndes 0-1-Muster in der Datumstabelle zu erstellen.
In diesem Tutorial führe ich eine Prognosetechnik durch, bei der ich meine tatsächlichen Ergebnisse mit meinen Prognosen vergleiche und sie kumulativ betrachte.
In diesem Blog erfahren Sie, wie Sie mit Power Automate E-Mail-Anhänge automatisch in SharePoint speichern und E-Mails anschließend löschen.
Erfahren Sie, wie die Do Until Schleifensteuerung in Power Automate funktioniert und welche Schritte zur Implementierung erforderlich sind.
In diesem Tutorial erfahren Sie, wie Sie mithilfe der ALLSELECTED-Funktion einen dynamischen gleitenden Durchschnitt in LuckyTemplates berechnen können.
Durch diesen Artikel erhalten wir ein klares und besseres Verständnis für die dynamische Berechnung einer laufenden oder kumulativen Gesamtsumme in LuckyTemplates.
Erfahren und verstehen Sie die Bedeutung und ordnungsgemäße Verwendung der Power Automate-Aktionssteuerung „Auf jede anwenden“ in unseren Microsoft-Workflows.