Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku dowiesz się, jak wykonać i zinterpretować test t dla sparowanych próbek za pomocą programu Excel. Możesz obejrzeć pełny film tego samouczka na dole tego bloga .
Test t dla sparowanych próbek sprawdzi różnicę w średnich obserwacji. Mamy więc do czynienia z danymi ilościowymi między jednym okresem a drugim. Ponadto mamy do czynienia z danymi szeregów czasowych.
To będzie test hipotezy ze wszystkimi elementami, które się z tym wiążą. Jeśli chcesz dowiedzieć się więcej o tym, jak przeprowadzić test hipotezy w Excelu, możesz zapoznać się z moją książką Advancing Into Analytics .
Nie będziemy zbytnio zagłębiać się w teorię, ale będziemy używać pakietu narzędzi analitycznych w Excelu, gdzie będziemy testować na poziomie istotności 95% i korzystać z recenzowanego zestawu danych z Plos One .
Zasadniczo chcemy sprawdzić, czy istnieje różnica w średnich dla Grupy 1 między czasem 1 a czasem 2. Spróbujemy odtworzyć badanie naukowe.
Spis treści
Wykonywanie i interpretacja sparowanych próbek T-test
Przejdźmy dalej i zanurzmy się w Excelu . Możemy przeprowadzić to dla każdego testu próbki, a potem przegrupujemy się i ruszymy dalej.
W tych danych są to indywidualni pacjenci. Zmierzono je w okresie zwanym tomem 1 , a następnie wykonano kolejny pomiar w tomie 2 .
Musimy znać pomiary w obu okresach, w przeciwnym razie nie możemy wykorzystać tych pacjentów ani tych obserwacji. To jedna rzecz, którą warto wiedzieć o teście t dla sparowanych próbek.
Weźmy średnią danych z tomu 1 i tomu 2, a następnie uzyskajmy różnicę między nimi. Wygląda na to, że Tom 2 jest nieco wyższy do 14.07.
Zaletą testowania hipotez jest to, że naprawdę możemy się w to zagłębić i zdecydować, czy to, co widzimy, to tylko przypadek, czy nie.
Następną rzeczą do zrobienia jest przejście do sekcji Dane , a następnie wybranie Narzędzia analizy danych . Jeśli nie znasz pakietu narzędzi, możesz zajrzeć do książki, aby dowiedzieć się, jak go zainstalować, lub przeprowadzić wyszukiwanie w Internecie.
Z opcji wybierz t-Test: Paired Two Sample for Means, a następnie kliknij przycisk OK .
W tym oknie musimy wprowadzić dwa zakresy.
Dla zakresu zmiennej 1 wybierz cały zakres danych tomu 1, naciskając klawisze CTRL + Shift + strzałka w dół . Zaznaczmy również cały zakres Volume 2 dla pola Variable 2 Range .
Mamy taką samą liczbę obserwacji w każdej grupie, co ma sens, ponieważ potrzebujemy tych obserwacji dla każdego pacjenta.
Ponieważ mamy etykiety w pierwszym rzędzie, zaznaczmy pole wyboru Etykiety , a następnie dla opcji Hipotetyczna średnia różnica pozostaw to pole puste. Zakładamy, że średnia różnica jest znacząco różna od zera. Możemy również sprawdzić, czy jest inny niż 5 lub -10, ale 0 jest najczęściej spotykane.
W przypadku zakresu wyjściowego możemy umieścić go w tym samym arkuszu, a następnie kliknąć OK .
Zauważalnie, jest to bardzo oparte na menu podejście do znajdowania różnicy w tym teście. Widzimy te same liczby, które widzieliśmy wcześniej.
Następnie chcę, abyś skupił swoją uwagę na wartości P(T<=t)> , która wynosi 0,751 . Oznacza to, że prawdopodobnie nie jest to znacząca różnica, chociaż statystycznie rzecz biorąc, ta liczba jest nieco wyższa. Nie możemy powiedzieć, że prawdopodobnie jest różna od 0.
Ponownie, celem jest przeniesienie analizy na wyższy poziom poprzez zastosowanie do niej testowania hipotez.
Na koniec sprawdźmy dane dla grupy 1.
Na podstawie tabeli możemy zobaczyć z Plos One Journal, że wartość p wynosi 0,751. Oznacza to, że udało nam się odtworzyć wyniki badań tego raportu, co jest niesamowite!
Uznanie również dla naukowców za opublikowanie ich danych i udostępnienie ich opinii publicznej, aby każdy mógł uzyskać do nich dostęp.
Najczęściej test t dla sparowanych próbek jest używany, gdy ma miejsce interwencja, czy to w medycynie, marketingu czy edukacji. Dlatego często jest to test z nauk społecznych, który można wykorzystać i dowiedzieć się, czy nastąpiła jakaś zmiana w ramach interwencji.
Jednak trudną stroną jest to, że musimy mieć obserwacje zarówno przed, jak i po interwencji, co często jest trudne do wykonania w środowisku biznesowym.
Test Chi-Square w Excelu: Porównanie zmiennych
Hacki Excela Każda firma powinna znać
ggplot2 Wykresy w Excelu dla zaawansowanych wizualizacji danych
Wniosek
Test t dla par próbek to procedura statystyczna stosowana do porównywania średnich dwóch powiązanych grup lub próbek. Jest powszechnie używany w sytuacjach, gdy masz dwie powiązane próbki, które chcesz porównać.
Dzięki temu jest dostępnym i wygodnym narzędziem dla badaczy i analityków, którzy potrzebują szybko i dokładnie porównać średnie dwóch powiązanych ze sobą grup.
Ogólnie rzecz biorąc, jest to niezbędne narzędzie dla każdego, kto pracuje z danymi i stara się wyciągnąć z nich sensowne wnioski.
Wszystkiego najlepszego,
Jerzego Mounta
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.