Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Na tym blogu będziemy kontynuować naszą serię o technikach tworzenia złożonych niestandardowych wizualizacji. Dzisiaj, korzystając z języka R w usłudze LuckyTemplates, nauczymy się tworzyć złożone wizualizacje za pomocą jednego wiersza kodu. Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Spis treści
Przegląd
Podsumowując, część 1 tej serii koncentrowała się na wykorzystaniu zewnętrznego narzędzia Quick Measures Pro do tworzenia grafiki SVG dla pulpitu nawigacyjnego. Oto nasze wyniki dla naszego samouczka dotyczącego niestandardowej grafiki SVG.
A dzisiaj nauczymy się, jak tworzyć te dość złożone wizualizacje pokazane poniżej, i zrobimy to za pomocą tylko jednego wiersza kodu. Te wizualizacje nie są łatwe do wykonania przy użyciu innych niestandardowych wizualizacji, ale dzięki tej technice możemy stworzyć całą stronę w zaledwie pięć minut.
Z pewnością możemy to zrobić za pośrednictwem Deneb , ale zajmie to znacznie więcej niż jedną linię kodu. W przypadku niektórych z nich, takich jak histogramy, możemy użyć niestandardowej wizualizacji, ale sposób, w jaki je podzielimy, wykracza poza ich możliwości.
Używanie R i RStudio w LuckyTemplates
Pierwszą rzeczą, o której należy wiedzieć, jest to, że robimy to za pomocą R . R ma złą reputację jako trudny w użyciu, ponieważ ludzie patrzą na niego i od razu myślą, że wymaga dużo kodowania i jest złożony, ale tak naprawdę nie jest.
R może być skomplikowane, gdy wykonuje się wiele analiz statystycznych, ale pod względem wizualnym, szczególnie pakietu, którego będziemy używać dzisiaj o nazwie GGPUBR , jest naprawdę prosty.
W tym samouczku założono, że masz już zainstalowane R i RStudio na swoim komputerze. Ale jeśli nie i nie wiesz, jak to zrobić, George Mount ma świetny samouczek , jak to wszystko skonfigurować. Możesz uzyskać dostęp do tego filmu jako członek LuckyTemplates.
Teraz, jeśli nie jesteś członkiem, na YouTube jest mnóstwo innych filmów na temat ładowania R i RStudio na swój komputer.
Pakiety R
R obsługuje wizualizacje głównie za pomocą pakietów . Dobrą rzeczą jest to, że R ma wiele odpowiedników do LuckyTemplates, a sposób, w jaki obsługuje wizualizacje, jest bardzo podobny do niestandardowych wizualizacji LuckyTemplates.
Istnieją dwa polecenia odnoszące się do pakietów w języku R, z których jednym jest install . Instalację uruchamia się tylko raz i jest to równoznaczne z pobraniem naszej niestandardowej wizualizacji z App Store.
W takim przypadku to, co zrobilibyśmy po raz pierwszy w RStudio (możemy to zrobić również bezpośrednio w LuckyTemplates), to po prostu uruchom install("ggpubr") i naciśnij Return. To się uruchomi, pobierze z repozytorium i załaduje to do twojej instalacji R.
Drugie polecenie to biblioteka . To jest coś, co musimy uruchomić w każdym raporcie, który tworzymy. Jest to odpowiednik załadowania niestandardowej wizualizacji do raportu po pobraniu ich z App Store.
Do tego samouczka potrzebne są dwa pakiety. Jeden nazywa się ggplot2 , który jest głównym silnikiem wykresów dla R.
Drugi pakiet to ggpubr , który jest uproszczoną wersją ggplot. Ma tak zwaną radiografię publikacyjną przy minimalnej konfiguracji i jest skonfigurowany tak, aby dobrze wyglądał z około 15 różnymi typami wykresów.
Tworzenie grafiki za pomocą RStudio
Teraz zobaczymy, jak pakiety działają bezpośrednio w usłudze LuckyTemplates.
Zestaw danych
W tym samouczku użyjemy zestawu danych Titanica. Ten zestaw danych zawiera informacje o wszystkich pasażerach, którzy byli na Titanicu — którzy przeżyli, którzy zginęli, w jakiej klasie byli pasażerowie, ich płeć i wiek, zapłaconą opłatę i miejsce wejścia na pokład.
Istnieją trzy lokalizacje ostatniej kolumny — Southampton, Cherbourg i Queenstown. Jest też kilku pasażerów, których miejsce pochodzenia jest nieznane.
To jest uproszczona wersja zestawu danych, którego użyjemy dzisiaj do naszej wizualizacji. Zacznijmy i stwórzmy od podstaw.
Używanie R w LuckyTemplates: wykres pudełkowy 1
Najpierw kliknij ikonę Skrypt języka R w okienku Wizualizacje. Na ekranie pojawi się wizualizacja.
Następnie wybierz pola, których będziemy używać, i przeciągnij je z okienka Pola do Wartości w okienku Wizualizacje. W tym przypadku przeciągnijmy Wiek i Płeć.
Zmień tytuł, wyrównaj go, zmień tekst i kolory tła itd., aby ulepszyć szablon. Możemy wprowadzić te zmiany, przechodząc do karty Formatowanie wizualizacji w okienku Wizualizacje.
W tytule wpisz „Statystyki pasażerów według wieku i płci” dla tego przykładu. Te preferencje dadzą nam wizualizację, która wygląda tak.
Następnie wróć do karty Tworzenie wizualizacji w okienku Wizualizacje. Nadal powinniśmy widzieć pola, które przeciągnęliśmy wcześniej w obszarze Wartości . Możemy teraz otworzyć edytor skryptów R , klikając ikonę strzałki w górę.
R ma to naprawdę wyjątkowe wywołanie zwane zestawem danych, które pobiera dane, które wprowadzasz z dodatku Power Query, czyli w tym przypadku z naszych dwóch pól — wieku i płci. Więc to będzie nasz zestaw danych.
Następnie wywołamy nasze dwie biblioteki — ggplot2 i ggpubr.
Wreszcie, oto nasz jeden wiersz kodu. Wkleimy go lub w twoim przypadku wpiszemy i to wszystko.
Jeśli naciśniemy Run , kod utworzy tę wizualizację wykresu pudełkowego.
Zasadniczo możemy myśleć o języku R jako o tekstowej wersji okienka Format w usłudze LuckyTemplates. W tym przypadku LuckyTemplates to przede wszystkim graficzny interfejs użytkownika.
Na przykład, jeśli przejdziemy do okienka Wizualizacje, możemy ustawić nasze preferencje dotyczące efektów, tła, obramowań i tak dalej.
W R używamy kodu do ustawiania tych preferencji. Na przykład możemy użyć kodu, aby włączyć efekty i tło lub wyłączyć wizualną ramkę.
Dla tła możemy zrobić kolor = biały i przezroczystość = 100, czyli tekstową wersję graficznego interfejsu użytkownika w LuckyTemplates.
Aby wiedzieć, jaki kod wprowadzić, używamy tego dokumentu, który ma każdy pakiet R. Możemy przejrzeć ten dokument i przejrzeć to, co nazywają winietami.
Te winiety pokazują nam różne typy wizualizacji do stworzenia, a następnie podają przykłady różnych parametrów. To jest przykład .
Na karcie Odniesienie znajduje się lista wszystkich różnych parametrów, których możemy użyć, takich jak kolor, wypełnienie konturu, paleta kolorów, typ linii, rozmiar i wiele innych. Możemy ustawić te parametry tak, jak chcemy, aby nasza wizualizacja wyglądała.
Wróćmy do LuckyTemplates i przeanalizujmy zawartość naszego kodu. Zaczynamy od naszego zestawu danych zawierającego nasze dwie zmienne, płeć i wiek. Dodajemy punkty za minimum, maksimum i inne ważne punkty.
Color = Sex oznacza, że kolor wykresu będzie oparty na płci. Następnie ustawiamy kolor wypełnienia na #F2F2F2, szerokość linii pola na 0,3 i wybieramy naszą paletę kolorów. Na koniec usuwamy naszą legendę, co kończy naszą jedną linię kodu R.
Używanie R w LuckyTemplates: wykres pudełkowy 2
Przejdźmy do naszej drugiej wizualizacji. Zaczniemy od zastąpienia naszego pierwszego kodu innym poleceniem, które wygląda tak.
W tym przykładzie to, co robimy, jest prawie tym samym, ale do tego czasu przechodzimy do facetingu. Funkcja facet.by jest odpowiednikiem małych wielokrotności, a na podstawie naszego kodu wykonujemy faceting przez Embarked.
Oznacza to, że bierzemy tę samą oprawę graficzną, ale teraz tworzymy małą, zwielokrotnioną wersję opartą na portach pochodzenia. Teraz, jeśli klikniemy Run , otrzymamy cztery wykresy pudełkowe, które pokazują dokładnie to, czego chcemy.
Używanie R w LuckyTemplates: Histogram 1
Przejdźmy do histogramów dla naszego trzeciego przykładu, używając następującego kodu.
Tworzymy prosty histogram na podstawie naszego kodu. Mamy tylko nasz zbiór danych, zmienną wieku, liczbę pojemników dla naszego histogramu i kolor wypełnienia. Następnie kliknij Uruchom .
Teraz możemy zobaczyć naszych pasażerów pogrupowanych według wieku.
Inną rzeczą, którą możemy zrobić, to użyć polecenia o nazwie add . Dodajmy linię środkową, używając add = „mediana” .
Kliknij Uruchom , a to pokaże nam medianę.
Możemy to również zmienić na oznaczające, używając add = „mean”.
Kliknij Run , a linia przesunie się od mediany do średniej.
Jak widzieliśmy, mamy wiele opcji w tych wizualizacjach. Możemy na przykład zmieniać kolory, tytuły i osie. Naprawdę nie ma parametru, którego nie moglibyśmy zmienić, aby pasował do naszego motywu lub sposobu, w jaki ma wyglądać nasza grafika.
Używanie R w LuckyTemplates: Histogram 2
Przejdźmy szybko do naszego następnego przykładu. Histogram 2 to histogram fasetowy, w tym przypadku fasetujemy według obu płci i tego, czy przeżyły, czy nie. W tej wizualizacji użyjemy następującego kodu.
Widzimy, że jest to rodzaj wizualizacji, który byłby dość trudny do stworzenia w jakikolwiek inny sposób. Ponownie możemy to zrobić za pośrednictwem Deneba, ale wymagałoby to sporej ilości kodu. Podczas gdy tutaj jest to tylko jedna prosta linia.
Używanie R w LuckyTemplates: Histogram 3
Zróbmy jeszcze jeden histogram i spojrzymy na to trochę inaczej. Tym razem przyjrzymy się, w jakiej klasie byli pasażerowie, i dodamy również linię środkową.
Kliknij Uruchom.
Patrząc na materiał wizualny, możemy również zauważyć, że najwięcej ofiar w tej katastrofie ponieśli żołnierze 3 klasy.
Zauważ, że w tym przykładzie użyliśmy domyślnego schematu kolorów, więc nie pasuje on do naszego motywu. Zrobiliśmy to celowo, aby zilustrować, w jaki sposób automatycznie wybiera schemat kolorów, jeśli go nie wprowadzimy.
Używanie R w LuckyTemplates: QQ Plot
Wreszcie dochodzimy do naszego ostatniego typu wykresu.
Ponownie, istnieje około 15 typów wykresów, które można tutaj uruchomić, a ten nazywa się wykresem QQ. Jeśli wykonałeś sporo pracy w statystykach, prawdopodobnie słyszałeś lub widziałeś wcześniej wykres QQ.
Nasz następny kod pomaga nam określić, czy dane pole jest dystrybuowane zgodnie z określonym rozkładem. W tym przypadku sprawdzamy, czy ma rozkład normalny, porównując rzeczywisty rozkład z rozkładem teoretycznym.
Podobnie jak w poprzednich przykładach, trudno jest to zrobić w jakikolwiek inny sposób. Ale używając naszej techniki, utworzenie naszego wykresu QQ z teoretyczną próbą zajmie kilka parametrów.
R Dla usługi LuckyTemplates | Przewodnik dla początkujących
Niestandardowe wizualizacje usługi LuckyTemplates — tworzenie aplikacji do raportowania
Niestandardowe raporty wizualne w usłudze LuckyTemplates
Wniosek
W dzisiejszym blogu nauczyliśmy się prostego sposobu tworzenia zaawansowanych i złożonych wizualizacji w LuckyTemplates przy użyciu R.
Oferuje ogromne możliwości zastosowania i elastyczność w tworzeniu wykresów, które są trudne do uzyskania w jakikolwiek inny sposób. Daje to również możliwość elastycznego dostosowania parametrów do własnych preferencji. Możesz zrobić o wiele więcej, jeśli chodzi o kolor tła i czcionkę oraz wszelkiego rodzaju formatowanie.
Używając pojedynczego wiersza kodu, niewiele musisz wiedzieć, aby tworzyć wnikliwe wykresy, które, mamy nadzieję, zainspirują Cię do wykorzystania tej techniki w przyszłych raportach.
W kolejnej części tej serii omówimy proste sposoby tworzenia świetnych kart KPI.
Wszystkiego najlepszego,
Brian Juliusz
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.