Test chi-kwadrat w programie Excel: porównywanie zmiennych

Test chi-kwadrat w programie Excel: porównywanie zmiennych

W tym poście pokażemy, jak używać testu chi-kwadrat w programie Excel do porównywania zmiennych. Możesz obejrzeć pełny film tego samouczka na dole tego bloga .

Test niezależności chi-kwadrat ma dwie zmienne kategoryczne. Dowiemy się, czy istnieje związek między tymi zmiennymi.

Będziemy korzystać z ram testowania hipotez. Jeśli nie znasz tego zagadnienia, zajrzyj do  książki Advancing Into Analytics  . Jest to zaawansowana technika analityczna wykorzystująca programy Excel , R i Python.

W naszej demonstracji użyjemy zestawu danych mieszkaniowych w programie Excel. Musimy uzyskać rzeczywiste wartości za pomocą tabeli przestawnej, a następnie porównać je z wartościami oczekiwanymi za pomocą formuł.

Sprawdzimy również 95% poziom istotności oraz czy istnieje związek między klimatyzacją a preferowanym obszarem.

Spis treści

Używanie testu chi-kwadrat w programie Excel do porównywania zmiennych

Przejdźmy do Excela. To są ceny mieszkań, które pochodzą z Journal of Applied Econometrics.

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Wstaw tabelę przestawną , a następnie kliknij przycisk  OK , aby użyć kolumny indeksu do zliczenia obserwacji.

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Z pól tabeli przestawnej przeciągnij „ id do sekcji Wartości. Wybierz  Count  z ustawień pola wartości, ponieważ są to wszystkie unikalne wartości. 

Następnie przeciągnij „ prefarea ” do kolumn, a następnie przeciągnij „ airco ” do sekcji wierszy, aby zobaczyć rzeczywiste wartości.

Mamy w sumie 546 obserwacji. 298 to ani klimatyzacja, ani preferowany obszar, podczas gdy 53 to jedno i drugie i tak dalej.

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Utwórzmy dwie tabele i oznaczmy je jako Actual i Expected .

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Aby uzyskać oczekiwane wartości ani dla klimatyzacji, ani dla preferowanego obszaru, pomnóż  D5  ​​przez  B7 , a następnie podziel przez  D7 .

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Następnie, aby uzyskać oczekiwaną wartość klimatyzacji lub preferowanego obszaru, pomnóż  D5  ​​przez  C7 , a następnie podziel przez  D7 .

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Teraz, aby uzyskać oczekiwaną wartość preferowanej powierzchni lub klimatyzacji, pomnóż  D6  przez  B7 , a następnie podziel przez  D7 .

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Na koniec obliczmy oczekiwaną wartość zarówno klimatyzacji, jak i preferowanej powierzchni. Pomnóż  D6  przez  C7 , a następnie podziel przez  D7 .

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Zaznacz zakres oczekiwanych wartości, aby znaleźć sumę, która powinna wynosić 546.

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Teraz znajdziemy związek między wartościami rzeczywistymi a oczekiwanymi. Sprawdźmy, czy w jakiś sposób mają tendencję do poruszania się razem.

Aby znaleźć istotność, wpisz  =CHISQ.TEST . Zaznacz zakres rzeczywistych wartości, dodaj przecinek, a następnie zaznacz zakres oczekiwanych wartości, aby uzyskać  wartość p .

Test chi-kwadrat w programie Excel: porównywanie zmiennych

Biorąc pod uwagę wynik, jest to niewielka szansa losowa. Wydaje się, że istnieje pewien związek między zmienną preferowanego obszaru a zmienną klimatyzacji.

Test chi-kwadrat w programie Excel: porównywanie zmiennych


Scalanie zapytań za pomocą Anti Join w Excelu z Power Query
Liczenie odrębnych wartości w Excelu: podejście klasyczne do nowoczesnego
Proporcje i tabele częstotliwości w Excelu

Wniosek

Test chi-kwadrat to powszechna technika, która pomaga nam rozpoznać różnicę według kategorii i jest dobrym przykładem testów A/B.

Kolejną rzeczą do zapamiętania jest to, że obserwacje muszą być niezależne. Opierając się na naszym przykładzie, patrzymy na dwie zmienne binarne, specyficzny typ zmiennej kategorycznej.

Na koniec pamiętajmy, że może to być trudne, gdy mamy wiele kategorii.

Mam nadzieję, że jest to coś, czego możesz użyć do testów A/B, czy to w Excelu , czy Pythonie.

Wszystkiego najlepszego,


Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Czym jest self w Pythonie: przykłady z życia wzięte

Jak zapisać i załadować plik RDS w R

Jak zapisać i załadować plik RDS w R

Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Powrót do pierwszych N dni roboczych — rozwiązanie języka kodowania DAX

Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

Zaprezentuj spostrzeżenia przy użyciu wielowątkowej techniki dynamicznych wizualizacji w usłudze LuckyTemplates

W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

Wprowadzenie do filtrowania kontekstu w usłudze LuckyTemplates

W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Najlepsze wskazówki dotyczące korzystania z aplikacji w usłudze online LuckyTemplates

Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Analizuj zmiany marży zysku w godzinach nadliczbowych — Analizuj za pomocą LuckyTemplates i DAX

Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.

Pomysły na materializację pamięci podręcznych danych w DAX Studio

Pomysły na materializację pamięci podręcznych danych w DAX Studio

W tym samouczku omówiono idee materializacji pamięci podręcznych danych oraz ich wpływ na wydajność języka DAX w dostarczaniu wyników.

Raportowanie biznesowe przy użyciu usługi LuckyTemplates

Raportowanie biznesowe przy użyciu usługi LuckyTemplates

Jeśli do tej pory nadal korzystasz z programu Excel, jest to najlepszy moment, aby zacząć korzystać z usługi LuckyTemplates na potrzeby raportowania biznesowego.

Co to jest brama LuckyTemplates? Wszystko co musisz wiedzieć

Co to jest brama LuckyTemplates? Wszystko co musisz wiedzieć

Co to jest brama LuckyTemplates? Wszystko co musisz wiedzieć