Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku omówimy czynniki i poziomy czynników w języku R. Dowiesz się, jak utworzyć czynnik i jak dostosować poziomy czynników.
Czynniki służą do przechowywania i pracy ze zmiennymi w R.
W tym samouczku zajmiesz się zmiennymi kategorialnymi i porządkowymi. Zmienne kategorialne to zmienne obejmujące jedną lub więcej kategorii, które nie są uporządkowane w żaden określony sposób. Przykładem mogą być kolory. Zmienne porządkowe natomiast są podobne do zmiennych kategorycznych z tą różnicą, że zmienne porządkowe mają wyraźne uporządkowanie kategorii. Może to być niski, średni i wysoki.
To jest wprowadzenie do bardziej statystycznych terminów. Teraz powoli odkrywasz możliwości języka R w zakresie danych i analizy statystycznej.
Spis treści
Kategoryczne poziomy czynników w R
Jeśli pamiętasz w innej lekcji o ramkach danych , użyłeś znaku dolara ( $ ) do wydrukowania kolumny Gatunek ze zbioru danych tęczówki . Zrób to ponownie w RStudio . W dolnej części znajduje się linia zawierająca poziomy składające się z setosa , versicolor i virginica .
To jest sposób, w jaki R radzi sobie z kategoriami w danych.
Jeśli użyjesz funkcji unique ( ) , R wyświetli listę unikalnych wartości w określonej kolumnie. Na przykład, jeśli uruchomisz unique (iris$Species) , konsola wyświetli poziom trzech gatunków tęczówki.
Nie ma nieodłącznej kolejności dla tych poziomów. Nie można powiedzieć, że setosa jest większa niż pozostałe dwie kategorie kolorystyczne. R domyślnie układa je w porządku alfabetycznym.
Poziomy czynników porządkowych w R
Teraz spróbujmy zbadać czynniki z nieodłącznym uporządkowaniem kategorii.
Utwórz wektor i nazwij go rzędami . W tym przykładzie przypisz ten wektor z danymi, używając nazw rozmiarów filiżanek Starbucks: wysoki, venti i grande. Następnie wydrukuj go.
Powinny one być ułożone od najmniejszego do największego; powinien być wysoki, venti i grande. Ale kiedy uruchamiasz funkcję unique ( ) dla zamówień , nie są one ułożone w tej kolejności.
Oto jak przekształcić je w zmienne porządkowe. Najpierw musisz utworzyć nowy wektor. W tym przypadku wektor nosi nazwę new_orders_factor . Przypisz temu wektorowi funkcję czynnika ( ) . Wewnątrz tej funkcji wprowadź wektor, za pomocą którego chcesz ustawić poziomy. Następnie wskaż poziomy w kolejności, w jakiej mają się pojawiać.
Zaznacz całą linię kodu, a następnie uruchom ją. Nowa wartość jest następnie dodawana w Środowisku.
Aby sprawdzić, czy wektor został prawidłowo przypisany jako czynnik, użyj funkcji is.factor ( ) . Jeśli sprawdzisz dwa wektory, zamówienia i czynnik new_orders_factor , zobaczysz, że ten pierwszy zwraca FALSE, podczas gdy nowy wektor jest rzeczywiście czynnikiem.
Współczynnik to specjalny sposób przechowywania serii tekstów. I chociaż jest to wektor znaków, można go przechowywać w sposób, który pozwala na posiadanie określonej liczby kategorii, które mają określoną kolejność wartości lub poziomów.
Jeśli sprawdzisz za pomocą funkcji poziomy ( ) , zobaczysz, że poziomy są teraz we właściwej kolejności.
Twórz wektory w R: Samouczek krok po kroku
Ramki danych w R: Nauka podstaw
Wniosek
Chociaż ta lekcja może wydawać się ezoteryczna, zobaczysz, jak to robi różnicę, gdy masz do czynienia z bardziej zaawansowanym kodowaniem R. Ważne jest, aby dowiedzieć się o czynnikach i poziomach, ponieważ często pojawiają się one w wielu kodach R i analizach statystycznych.
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.