Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

W tym samouczku omówimy czynniki i poziomy czynników w języku R. Dowiesz się, jak utworzyć czynnik i jak dostosować poziomy czynników.

Czynniki służą do przechowywania i pracy ze zmiennymi w R.

W tym samouczku zajmiesz się zmiennymi kategorialnymi i porządkowymi. Zmienne kategorialne to zmienne obejmujące jedną lub więcej kategorii, które nie są uporządkowane w żaden określony sposób. Przykładem mogą być kolory. Zmienne porządkowe natomiast są podobne do zmiennych kategorycznych z tą różnicą, że zmienne porządkowe mają wyraźne uporządkowanie kategorii. Może to być niski, średni i wysoki.

To jest wprowadzenie do bardziej statystycznych terminów. Teraz powoli odkrywasz możliwości języka R w zakresie danych i analizy statystycznej.

Spis treści

Kategoryczne poziomy czynników w R

Jeśli pamiętasz w innej lekcji o ramkach danych , użyłeś znaku dolara ( $ ) do wydrukowania kolumny Gatunek ze zbioru danych tęczówki . Zrób to ponownie w RStudio . W dolnej części znajduje się linia zawierająca poziomy składające się z setosa , versicolor i virginica .

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

To jest sposób, w jaki R radzi sobie z kategoriami w danych.

Jeśli użyjesz funkcji unique ( ) , R wyświetli listę unikalnych wartości w określonej kolumnie. Na przykład, jeśli uruchomisz unique (iris$Species) , konsola wyświetli poziom trzech gatunków tęczówki.

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

Nie ma nieodłącznej kolejności dla tych poziomów. Nie można powiedzieć, że setosa jest większa niż pozostałe dwie kategorie kolorystyczne. R domyślnie układa je w porządku alfabetycznym.

Poziomy czynników porządkowych w R

Teraz spróbujmy zbadać czynniki z nieodłącznym uporządkowaniem kategorii.

Utwórz wektor i nazwij go rzędami . W tym przykładzie przypisz ten wektor z danymi, używając nazw rozmiarów filiżanek Starbucks: wysoki, venti i grande. Następnie wydrukuj go.

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

Powinny one być ułożone od najmniejszego do największego; powinien być wysoki, venti i grande. Ale kiedy uruchamiasz funkcję unique ( ) dla zamówień , nie są one ułożone w tej kolejności.

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

Oto jak przekształcić je w zmienne porządkowe. Najpierw musisz utworzyć nowy wektor. W tym przypadku wektor nosi nazwę new_orders_factor . Przypisz temu wektorowi funkcję czynnika ( ) . Wewnątrz tej funkcji wprowadź wektor, za pomocą którego chcesz ustawić poziomy. Następnie wskaż poziomy w kolejności, w jakiej mają się pojawiać.

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

Zaznacz całą linię kodu, a następnie uruchom ją. Nowa wartość jest następnie dodawana w Środowisku.

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

Aby sprawdzić, czy wektor został prawidłowo przypisany jako czynnik, użyj funkcji is.factor ( ) . Jeśli sprawdzisz dwa wektory, zamówienia i czynnik new_orders_factor , zobaczysz, że ten pierwszy zwraca FALSE, podczas gdy nowy wektor jest rzeczywiście czynnikiem.

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych

Współczynnik to specjalny sposób przechowywania serii tekstów. I chociaż jest to wektor znaków, można go przechowywać w sposób, który pozwala na posiadanie określonej liczby kategorii, które mają określoną kolejność wartości lub poziomów.

Jeśli sprawdzisz za pomocą funkcji poziomy ( ) , zobaczysz, że poziomy są teraz we właściwej kolejności.

Poziomy czynników w R: używanie zmiennych kategorialnych i porządkowych


Twórz wektory w R: Samouczek krok po kroku
Ramki danych w R: Nauka podstaw

Wniosek

Chociaż ta lekcja może wydawać się ezoteryczna, zobaczysz, jak to robi różnicę, gdy masz do czynienia z bardziej zaawansowanym kodowaniem R. Ważne jest, aby dowiedzieć się o czynnikach i poziomach, ponieważ często pojawiają się one w wielu kodach R i analizach statystycznych.

Leave a Comment

Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr

Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr

W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.

Funkcje zbierania w Microsoft Power Automate

Funkcje zbierania w Microsoft Power Automate

Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.

Oceń wydajność kodu DAX w DAX Studio

Oceń wydajność kodu DAX w DAX Studio

Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.

Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Jak zapisać i załadować plik RDS w R

Jak zapisać i załadować plik RDS w R

Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.