Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

Pakiet ggplot2 to najbardziej wszechstronny sposób budowania wykresów i wykresów. Firmy, takie jak New York Times i The Economist, intensywnie używają ggplot2 do tworzenia swoich wizualizacji. W przypadku dużych firm korzystających z tego narzędzia ważne jest posiadanie bazy wiedzy na temat korzystania z ggplot2 do tworzenia wizualizacji, takich jak wykres jittera.

W tym samouczku dowiesz się, jak utworzyć wykres jitter przy użyciu ggplot2 w . Gdy zrozumiesz gramatykę grafiki w ggplot2, będziesz w stanie połączyć dowolny wykres lub wykres.

Wykres jitterplot jest rodzajem wykresu punktowego używanego do wyświetlania rozkładu zbioru liczbowych punktów danych. „Ryzyko” w nazwie wykresu odnosi się do losowej zmiany, która jest dodawana do pozycji każdego symbolu wzdłuż osi x i y.

Ta odmiana pomaga zapobiegać nakładaniu się symboli i ułatwia obserwację rozkładu punktów danych w przypadku dużej gęstości punktów w niektórych obszarach wykresu.

Jeśli wykres jest gęsto zaludniony, wykres drgań może ułatwić zrozumienie wizualizacji. Można go również użyć do wykreślenia rozkładów według kategorii, co stanowi alternatywę dla wykresu pudełkowego lub histogramu .

Spis treści

Tworzenie wykresu jittera w R

Do tej demonstracji używany jest zestaw danych tidyverse .

Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

Najpierw utwórz wykres punktowy za pomocą funkcji ggplot () . W tym przypadku oś x to rok, a oś y to zbiór danych mpg.

Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

Po uruchomieniu kodu widać, że wykres pokazuje punkty tworzące linię prostą względem osi y.

Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

Użyj funkcji geom_jitter ( ) , aby dodać kolejną warstwę do wykresu. Po uruchomieniu kodu zobaczysz, że punkty na wykresie zostały przesunięte. Punkty będą się przesuwać za każdym razem, gdy uruchomisz kod.

Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

Aby zapobiec ciągłemu przesuwaniu się punktów, użyj funkcji set.seed ( ) . W nawiasie wpisz dowolną losową liczbę. W tym przypadku jest to 1234. Po uruchomieniu kodu zobaczysz, że wykres pozostaje taki sam, nawet jeśli wielokrotnie klikasz Uruchom.

Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

Tworzenie wykresu fluktuacji ze zmiennymi kategorialnymi

Możesz także użyć funkcji geom_jitter ( ) dla zmiennych kategorialnych.

Używając tego samego argumentu, zmieńmy oś x na mpg, a oś y na początek. Po uruchomieniu nowego wiersza kodu można zauważyć, że zamiast pokazywać dane w liniach prostych, są one losowo rozmieszczone na wykresie.

Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

Pomaga to w wizualizacji poszczególnych obserwacji dla każdej kategorii i ich różnic. W tym przypadku możesz zobaczyć typowy przebieg jednego pochodzenia w porównaniu z innym.

Możesz dodać kolor do wykresu, dodając kolejny argument w funkcji aes () . Możesz także ustawić rozmiar punktów na określoną wartość danych w swoim zbiorze danych.

Tworzenie wykresu jittera za pomocą Ggplot2 w RStudio

W tym przykładzie wykres jittera ułatwił identyfikację pochodzenia większości samochodów i tych, które mają lepszy przebieg.

Ze względu na rozmiar ustawiony w kodzie wykres wygląda na przesycony. Możesz zmienić rozmiar lub kolor punktów danych w zależności od preferencji lub wymagań biznesowych.

Wniosek

Wykres jittera to jeden ze sposobów na wprowadzenie nowej formy wglądu w wizualizacje. Pomaga użytkownikom lepiej zrozumieć, co dzieje się z danymi. Ten wykres jest świetną alternatywą dla typowego histogramu lub wykresu pudełkowego do kreślenia rozkładów.

Zdolność do skutecznego zrozumienia podstawowej struktury zbioru danych sprawia, że ​​wykresy jittera są cennym narzędziem w różnych dziedzinach, takich jak statystyka, analiza danych i uczenie maszynowe. Ogólnie rzecz biorąc, wykresy jittera zapewniają jasną i łatwą do zrozumienia reprezentację rozkładu liczbowych punktów danych, co czyni je potężnym narzędziem do wizualizacji i analizy danych.

Wszystkiego najlepszego,

Jerzego Mounta

Leave a Comment

Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr

Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr

W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.

Funkcje zbierania w Microsoft Power Automate

Funkcje zbierania w Microsoft Power Automate

Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.

Oceń wydajność kodu DAX w DAX Studio

Oceń wydajność kodu DAX w DAX Studio

Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.

Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Jak zapisać i załadować plik RDS w R

Jak zapisać i załadować plik RDS w R

Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.