Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Tworzenie wizualizacji w R przy użyciu ggplot2 może być skutecznym sposobem eksploracji i zrozumienia danych. Jednym z powszechnych typów wizualizacji jest wykres dwuwymiarowy, który pozwala zbadać związek między dwiema zmiennymi.
W tym samouczku dowiesz się, jak tworzyć dwuwymiarowe wizualizacje w R przy użyciu ggplot2. Ten blog skupi się w szczególności na wizualizacjach , które byłyby trudne do wykonania w LuckyTemplates, ale łatwe do wykonania w R.
Spis treści
Przegląd
W tym samouczku zostaną omówione trzy główne tematy. Dowiesz się, jak wizualizować rozkłady zmiennej według grup oraz jak wizualizować korelacje i relacje parami.
Zależność parami odnosi się do relacji między każdą parą zmiennych w danym zbiorze danych.
W tym samouczku musisz pobrać pakiet ggplot2 . Po zakończeniu otwórz pusty skrypt R i wprowadź dwie biblioteki: tidyverse i GGally .
GGally jest rozszerzeniem do ggplot2. Został zbudowany w celu zmniejszenia złożoności łączenia obiektów geometrycznych z przekształconymi danymi.
Różne dwuwymiarowe wizualizacje w R
Wizualizacja dwuwymiarowa pokazuje związek między dwiema zmiennymi.
Jako przykład utwórzmy wizualizację pokazującą związek między miastem a autostradą. Należy użyć funkcji ggplot( ) , a następnie przypisać odpowiednie dane.
Funkcja geom_point () jest następnie używana do generowania wykresu punktowego .
Wizualizacje W R Pokazują Korelację
Funkcja ggcorr () służy do wizualizacji korelacji między zmiennymi. Spowoduje to wygenerowanie mapy cieplnej z wyświetlanymi wartościami korelacji od najniższych do najwyższych. Możesz dodatkowo poprawić wizualizację, dodając argument, który pokaże etykiety.
Wizualizacje w R przedstawiające związek parami
W przypadku wykresu parami należy użyć funkcji ggpairs ( ) .
Ponieważ ramka danych w tym przykładzie zawiera duży zbiór danych, należy ją najpierw przefiltrować, aby wyświetlała tylko wartości liczbowe, w przeciwnym razie wyniki pokażą błąd.
Aby filtrować dane, użyj operatora potoku i funkcji select_if ( ) .
W zakładce Plots możesz zobaczyć wizualizację parami wygenerowaną przez kod. Możesz także zobaczyć wykres i wartość korelacji między każdą zmienną.
Inną rzeczą, którą możesz zrobić z wykresami parami, jest dodanie dodatkowych elementów w celu rozszerzenia wizualizacji. Możesz dodać kolejną zmienną i zmienić kolor danych.
W tym przypadku kolumna dysku jest dodawana do kodu, a funkcja estetycznego mapowania służy do zmiany jego koloru.
Po uruchomieniu kodu zobaczysz, że wykres przedstawia wykresy punktowe i wartości korelacji według dysku. Przekątna pokazuje również rozkład według każdego napędu.
Wniosek
Jeśli chcesz tworzyć solidne i poparte statystycznie wizualizacje, takie jak histogramy, wykresy punktowe i wykresy pudełkowe, zalecamy użycie ggplot2 z GGally.
Język programowania R wraz z różnymi pakietami wizualizacji, takimi jak ggplot2, umożliwia użytkownikom tworzenie wizualizacji, które pokazują związek i korelację między zmiennymi.
GGally rozszerza ggplot2, rozszerzając kilka funkcji, które zmniejszają złożoność. Jeśli spróbujesz utworzyć dwuwymiarowe i wielowymiarowe wizualizacje w usłudze LuckyTemplates, okażą się one wyzwaniem. Jednak w języku programowania R wystarczy napisać tylko jedną linię kodu, aby uzyskać potrzebny wykres statystyczny.
Wszystkiego najlepszego,
Jerzego Mounta
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.