Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku dowiesz się, jak utworzyć wizualizację wykresu punktowego przy użyciu skryptu języka R. Jest to oparte na raporcie przesłanym w ramach konkursu . Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Spis treści
Co to jest wykres punktowy
Wykres punktowy to rodzaj wizualizacji danych, który służy do wyświetlania relacji między dwiema zmiennymi ciągłymi. Jest to wykres, na którym każdy punkt danych jest reprezentowany przez kropkę, a położenie kropki na osi poziomej i pionowej odpowiada wartościom dwóch zmiennych.
Wykresy punktowe to przydatne narzędzia do identyfikowania wzorców i trendów w danych. Dodanie tej wizualizacji do raportów usługi LuckyTemplates zapewni lepszy wgląd w prezentowane dane. Pod koniec tego samouczka będziesz w stanie utworzyć wykres punktowy R, który wygląda tak:
Ta dyskusja jest podzielona na cztery etapy. Najpierw nauczysz się tworzyć podstawowy wykres punktowy. Następnie zastosujesz gładką linię, aby pokazać trend danych na wykresie. Trzeci i czwarty krok koncentrują się głównie na motywach i zmianach formatowania, które można zastosować do wykresu punktowego.
Zestaw danych używany w tym przykładzie to tabela zawierająca nazwę klienta, czas trwania, zarobki i stawkę godzinową.
Utwórz podstawowy wykres punktowy w wizualizacji skryptu języka R
Otwórz .
Aby rozpocząć, musisz mieć trzy pakiety zainstalowane w swoim programie RStudio : tidyverse , ggthemes i ggpubr .
Jeśli nie masz ich zainstalowanych, użyj funkcji install.packages() . Po zakończeniu musisz użyć funkcji library() , aby załadować je do środowiska R.
Skopiuj kody biblioteki R i przejdź do usługi LuckyTemplates. Otwórz edytor skryptów języka R i wklej kod. Możesz tam kontynuować budowanie kodu R.
Następnie użyj funkcji ggplot() , aby utworzyć wykres punktowy. Najpierw musisz określić zestaw danych, który zostanie użyty na wykresie, stąd polecenie bazy danych %>% . W takim przypadku zamiast funkcji filtru używany jest operator potoku .
Aby określić zbiór danych, należy użyć argumentu aes() , a następnie określić osie x i y. W tym przypadku jest to odpowiednio czas trwania i zarobki. Następnie użyj funkcji geom_point() , aby wyświetlić punkty na wykresie.
Możesz dalej wprowadzać zmiany formatowania wykresu punktowego, używając różnych funkcji, takich jak „kolor” lub „kształt”. Jeśli chcesz zastosować dynamiczny wygląd wykresu, możesz ustawić kolor i rozmiar punktu na określoną wartość, jak pokazano w przykładzie.
Po uruchomieniu kodu otrzymasz ten wykres punktowy w usłudze LuckyTemplates. Zauważ, że otrzymujesz większe i ciemniejsze kółka, gdy ich równowartość stawki godzinowej jest wyższa.
Dodaj Gładką Linię Do Wykresu
W następnym kroku dowiesz się, jak dodać gładką linię do wykresu. Linia gładka to linia dopasowana do danych, która pomaga zbadać potencjalne relacje między dwiema zmiennymi.
Aby dodać gładką linię, użyj funkcji geom_smooth() .
Po uruchomieniu skryptu R wykres punktowy będzie wyglądał następująco. Linia gładka pokazuje teraz trend danych w 95% przedziale ufności.
Możesz zmienić skalę osi x i y za pomocą funkcji scale_x_continuous() i scale_y_continuous() .
W tym przypadku oś y jest przekształcana w skalę logarytmiczną, podczas gdy oś x pozostaje taka sama.
Po uruchomieniu kodu R wyniki będą teraz wyświetlane logarytmicznie. Gładka linia również się zmienia.
Ponadto, ponieważ wykres automatycznie umieszcza etykiety na osiach, możesz je usunąć za pomocą funkcji labs() .
Sformatuj wygląd wykresu punktowego R
Po utworzeniu podstawowej formy wykresu punktowego następnym krokiem jest dostosowanie jego motywu i wyglądu.
Użyj funkcji theme() , aby sformatować wykres punktowy w edytorze skryptów języka R. W ramach tej funkcji możesz dodać inne argumenty, aby dostosować.
Polecenia panel.grid.major ( ) i panel.grid.minor( ) umożliwiają edycję rodzaju i koloru linii siatki wykresu. Jeśli chcesz usunąć linię siatki, użyj funkcji element_blank() .
Elementy panel.background i plot.background są usuwane, aby wykres punktowy stał się przezroczysty. Pozwala to na elastyczne umieszczanie wykresu w dowolnym miejscu raportu. Jeśli chcesz usunąć legendę z wykresu, ustaw funkcję legend.position na „none”.
Możesz także sformatować linię i tekst osi x i y. Możesz sprawić, by linia była grubsza lub cieńsza, a tekst większy lub mniejszy.
Jeśli chcesz dowiedzieć się więcej o innych funkcjach formatowania, których możesz użyć na wykresie, możesz przejść do sekcji Pomoc w programie RStudio . Wpisz „motyw” w pasku wyszukiwania, a pojawi się lista funkcji formatowania.
Istnieje wiele funkcji formatowania, których możesz użyć w R. Pamiętaj, aby używać tego, czego potrzebujesz i nie przesadzaj.
Dostosuj kolor i zakres punktów danych
W ostatniej części tego samouczka dowiesz się, jak sformatować skalę kolorów i zakres rozmiarów punktów na wykresie punktowym.
Funkcja scale_colour_viridis_b() dostarcza mapy kolorów, które są percepcyjnie jednolite zarówno w kolorze, jak iw czerni i bieli. Są również zaprojektowane tak, aby były postrzegane przez widzów z powszechnymi formami daltonizmu.
Jeśli przeszukasz go w sekcji Pomoc w programie RStudio, zobaczysz różne argumenty, których możesz użyć do sformatowania wykresów. Możesz przełączać się między opcjami, aby dowiedzieć się, który wynik najlepiej pasuje do Twojego raportu.
Na przykład funkcja scale_size_continuous() skaluje rozmiar punktów lub kształtów na wykresie zgodnie ze zmienną ciągłą. Pozwala określić minimalne i maksymalne rozmiary punktów, które mają być użyte na wykresie.
W tym przypadku 4 to minimum, a 17 to maksimum.
Tak teraz wygląda końcowy wykres punktowy R.
Wniosek
Z tego samouczka dowiedziałeś się, jak utworzyć wykres punktowy R w usłudze LuckyTemplates. Wykres punktowy to rodzaj wizualizacji danych używany do wyświetlania relacji między dwiema zmiennymi ciągłymi. W usłudze LuckyTemplates możesz utworzyć wykres punktowy przy użyciu pakietu ggplot i wizualizacji R Script.
Wykresy punktowe to przydatne narzędzia do wizualizacji i identyfikowania wzorców i trendów w danych. Są również przydatne do identyfikowania wartości odstających lub anomalii.
Ogólnie rzecz biorąc, tworzenie wykresu punktowego w usłudze LuckyTemplates przy użyciu języka R jest prostym procesem i umożliwia korzystanie z zaawansowanych możliwości wizualizacji danych pakietu ggplot.
Wszystkiego najlepszego,
Hossein Seyedagha
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.