Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Pakiet ggplot2 to najbardziej wszechstronny sposób budowania wykresów i wykresów. Firmy, takie jak New York Times i The Economist, intensywnie używają ggplot2 do tworzenia swoich wizualizacji. W przypadku dużych firm korzystających z tego narzędzia ważne jest posiadanie bazy wiedzy na temat korzystania z ggplot2 do tworzenia wizualizacji, takich jak wykres jittera.
W tym samouczku dowiesz się, jak utworzyć wykres jitter przy użyciu ggplot2 w . Gdy zrozumiesz gramatykę grafiki w ggplot2, będziesz w stanie połączyć dowolny wykres lub wykres.
Wykres jitterplot jest rodzajem wykresu punktowego używanego do wyświetlania rozkładu zbioru liczbowych punktów danych. „Ryzyko” w nazwie wykresu odnosi się do losowej zmiany, która jest dodawana do pozycji każdego symbolu wzdłuż osi x i y.
Ta odmiana pomaga zapobiegać nakładaniu się symboli i ułatwia obserwację rozkładu punktów danych w przypadku dużej gęstości punktów w niektórych obszarach wykresu.
Jeśli wykres jest gęsto zaludniony, wykres drgań może ułatwić zrozumienie wizualizacji. Można go również użyć do wykreślenia rozkładów według kategorii, co stanowi alternatywę dla wykresu pudełkowego lub histogramu .
Spis treści
Tworzenie wykresu jittera w R
Do tej demonstracji używany jest zestaw danych tidyverse .
Najpierw utwórz wykres punktowy za pomocą funkcji ggplot () . W tym przypadku oś x to rok, a oś y to zbiór danych mpg.
Po uruchomieniu kodu widać, że wykres pokazuje punkty tworzące linię prostą względem osi y.
Użyj funkcji geom_jitter ( ) , aby dodać kolejną warstwę do wykresu. Po uruchomieniu kodu zobaczysz, że punkty na wykresie zostały przesunięte. Punkty będą się przesuwać za każdym razem, gdy uruchomisz kod.
Aby zapobiec ciągłemu przesuwaniu się punktów, użyj funkcji set.seed ( ) . W nawiasie wpisz dowolną losową liczbę. W tym przypadku jest to 1234. Po uruchomieniu kodu zobaczysz, że wykres pozostaje taki sam, nawet jeśli wielokrotnie klikasz Uruchom.
Tworzenie wykresu fluktuacji ze zmiennymi kategorialnymi
Możesz także użyć funkcji geom_jitter ( ) dla zmiennych kategorialnych.
Używając tego samego argumentu, zmieńmy oś x na mpg, a oś y na początek. Po uruchomieniu nowego wiersza kodu można zauważyć, że zamiast pokazywać dane w liniach prostych, są one losowo rozmieszczone na wykresie.
Pomaga to w wizualizacji poszczególnych obserwacji dla każdej kategorii i ich różnic. W tym przypadku możesz zobaczyć typowy przebieg jednego pochodzenia w porównaniu z innym.
Możesz dodać kolor do wykresu, dodając kolejny argument w funkcji aes () . Możesz także ustawić rozmiar punktów na określoną wartość danych w swoim zbiorze danych.
W tym przykładzie wykres jittera ułatwił identyfikację pochodzenia większości samochodów i tych, które mają lepszy przebieg.
Ze względu na rozmiar ustawiony w kodzie wykres wygląda na przesycony. Możesz zmienić rozmiar lub kolor punktów danych w zależności od preferencji lub wymagań biznesowych.
Wniosek
Wykres jittera to jeden ze sposobów na wprowadzenie nowej formy wglądu w wizualizacje. Pomaga użytkownikom lepiej zrozumieć, co dzieje się z danymi. Ten wykres jest świetną alternatywą dla typowego histogramu lub wykresu pudełkowego do kreślenia rozkładów.
Zdolność do skutecznego zrozumienia podstawowej struktury zbioru danych sprawia, że wykresy jittera są cennym narzędziem w różnych dziedzinach, takich jak statystyka, analiza danych i uczenie maszynowe. Ogólnie rzecz biorąc, wykresy jittera zapewniają jasną i łatwą do zrozumienia reprezentację rozkładu liczbowych punktów danych, co czyni je potężnym narzędziem do wizualizacji i analizy danych.
Wszystkiego najlepszego,
Jerzego Mounta
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.