Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku zajmiemy się tabelami częstości w programie Excel oraz tabelami proporcji. Przyjrzymy się, czym są i kiedy ich używać. Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Zmienne kategorialne mierzą „coś”, niezależnie od tego, czy jest to stan zakupu klienta, kraj pochodzenia czy coś innego. Podsumowując te typy zmiennych, możemy policzyć częstości każdego typu, porównując wielkości w tabelach częstości. Czasami jednak pomocne jest porównanie tych wartości w procentach, i tu właśnie pojawiają się tabele proporcji. Pokażę ci, jak wykonać obie te czynności w Excelu za pomocą tabel przestawnych, wraz z zaletami i wadami porównywania nieprzetworzonych ilości kategorii z ich proporcje.
Spis treści
Jak korzystać z tabel proporcji i częstotliwości w programie Excel
Pierwszą rzeczą, którą zamierzam zrobić, jest utworzenie kolumny indeksu. Próbuję tu policzyć, powiedzmy, ile z tych domów ma podjazd lub nie. Rzecz w tabelach przestawnych polega na tym, że będą chcieli agregować dane. Nie chcemy agregować danych. Chcemy policzyć liczbę obserwacji.
Inną rzeczą, którą zamierzam zrobić, i nie jest to konieczne w tym przypadku, ale naprawdę wolę i nalegam, aby moje dane w Excelu były przechowywane w tabeli. Więc klikam OK.
Następnie możemy zmienić nazwę tabeli. Nazwijmy to Osiedlem .
Teraz wstawię tabelę przestawną. Nasz zakres danych to mieszkania . Jest już jedna korzyść. Jest bardzo jasne, jakie są nasze dane źródłowe, więc umieśćmy je w istniejącym arkuszu.
Ile domów ma podjazd? Cóż, możemy się tego dowiedzieć. Przeniosę „ podjazd ” do Rzędów, a następnie zaniosę indeks do Wartości. Przejdę do ustawień pola Wartości i ustawię to jako count .
Obecnie obserwujemy 546 domów, z których 77 nie ma podjazdu, a 469 ma. To są nasze częstotliwości.
Niekoniecznie możemy podzielić tak przez nie, ale możemy policzyć, czy każde z nich jest tak, czy nie. Następnie kończymy z tym numerem. Nazywa się to jednokierunkową tabelą częstości w Excelu, ponieważ liczymy częstotliwości w jedną stronę przez jedną zmienną.
Teraz zróbmy z tego dwukierunkową tablicę częstości.
Zamierzam wziąć, powiedzmy, klimatyzację i przeciągnąć to do Kolumn. Możesz przeciągnąć go do wierszy, ale bardziej powszechne jest umieszczanie dwukierunkowej tabeli częstości w ten sposób, gdzie mamy jedną zmienną w kolumnach, a drugą w dół wierszy.
Jeśli się nad tym zastanowić, nadal widzimy 77 i 469, z wyjątkiem tego, że podzieliliśmy je klimatyzacją domów, nie lub tak. Możemy więc powiedzieć, że spośród 546 domów mamy 158 z klimatyzacją i podjazdem, 62 z nich nie ma ani jednego, ani drugiego.
Nazywa się to dwukierunkową tablicą częstości, która jest również nazywana tablicą kontyngencji.
Mamy 546 domów, ale trudno dokładnie wiedzieć, jaki procent wartości znajduje się w każdym z tych wiader, prawda? Jeśli nie jesteś naprawdę dobry w matematyce, może być trudno bardzo szybko podzielić 62 na 546 i zrozumieć, jaki procent każdego z nich znajduje się w tych wiaderkach.
Więc zamierzam kliknąć Count of Index , przejść do Show Values As , a następnie zrobię z tego % sumy całkowitej .
W ten sposób zamieniliśmy te surowe wartości na procenty. Pod pewnymi względami te liczby są dla nas łatwiejsze do zrozumienia. Jest to dla nas bardziej intuicyjny sposób patrzenia na dane.
Może chcemy wiedzieć, jaki procent rekordów nie ma podjazdu, a jaki procent z nich jest na nie, a na tak dla klimatyzacji. Wtedy moglibyśmy zmienić nasze wartości. Uczynilibyśmy to Row Total .
Więc przecinamy każdy z tych wierszy, sprawdzając jaki procent jest w każdym z nich.
Jedną rzeczą, która jest trudna z tymi wartościami procentowymi, jest to, że sztucznie zmniejszyliśmy dane. Nie wiemy 2,7, 5% tego, co warto wiedzieć. Jeśli jest naprawdę mały, jeśli wynosi 2,7, 5% ze 120 obserwacji, to jest to niewielka liczba, prawda? Jeśli jest to 2,7, 5% z tysiąca obserwacji, to wciąż jest to spora liczba.
Brakuje nam kontekstu, gdy patrzymy na rzeczy w procentach. Więc przeciągnę tutaj swój indeks, przeciągnę go dwukrotnie i zmienię na count .
A teraz widzimy zarówno proporcje, jak i częstotliwości. Mógłbym nawet dokładnie to wpisać. Możemy zrobić dodatkowe formatowanie.
Tabele częstości w programie Excel i tabele proporcji dotyczą zmiennych kategorialnych. Musimy je policzyć. Nie możemy zrobić innej matematyki. Możemy spojrzeć na surowe liczby. Przyjrzeliśmy się także proporcjom.
Dołączanie kilku arkuszy w programie Excel do usługi LuckyTemplates
Podstawy funkcji Unpivot i Pivot w usłudze LuckyTemplates — recenzja edytora zapytań
LuckyTemplates i Excel: różnica w formułach języka DAX
Wniosek
Mam nadzieję, że dowiesz się czegoś o tabelach częstości i proporcji oraz o tym, jak to zrobić w Excelu przy użyciu tej kolumny indeksu.
Surowe częstotliwości dostarczają nam wielu informacji o danych, ponieważ nie zmniejszamy ich sztucznie, ale porównanie względnej wielkości każdej z tych liczb może być trudne. Podczas gdy w przypadku tabel proporcji znacznie łatwiej jest patrzeć na rzeczy, gdy są one podzielone na 100. Ale w pewnym sensie możemy powiedzieć, że kiedy to robimy, tracimy kontekst.
Mam nadzieję, że podobał Ci się ten samouczek. Sprawdź poniższe linki, aby uzyskać więcej powiązanych treści.
Wszystkiego najlepszego,
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.