Czym jest self w Pythonie: przykłady z życia wzięte
Czym jest self w Pythonie: przykłady z życia wzięte
W tym poście pokażemy, jak używać testu chi-kwadrat w programie Excel do porównywania zmiennych. Możesz obejrzeć pełny film tego samouczka na dole tego bloga .
Test niezależności chi-kwadrat ma dwie zmienne kategoryczne. Dowiemy się, czy istnieje związek między tymi zmiennymi.
Będziemy korzystać z ram testowania hipotez. Jeśli nie znasz tego zagadnienia, zajrzyj do książki Advancing Into Analytics . Jest to zaawansowana technika analityczna wykorzystująca programy Excel , R i Python.
W naszej demonstracji użyjemy zestawu danych mieszkaniowych w programie Excel. Musimy uzyskać rzeczywiste wartości za pomocą tabeli przestawnej, a następnie porównać je z wartościami oczekiwanymi za pomocą formuł.
Sprawdzimy również 95% poziom istotności oraz czy istnieje związek między klimatyzacją a preferowanym obszarem.
Spis treści
Używanie testu chi-kwadrat w programie Excel do porównywania zmiennych
Przejdźmy do Excela. To są ceny mieszkań, które pochodzą z Journal of Applied Econometrics.
Wstaw tabelę przestawną , a następnie kliknij przycisk OK , aby użyć kolumny indeksu do zliczenia obserwacji.
Z pól tabeli przestawnej przeciągnij „ id ” do sekcji Wartości. Wybierz Count z ustawień pola wartości, ponieważ są to wszystkie unikalne wartości.
Następnie przeciągnij „ prefarea ” do kolumn, a następnie przeciągnij „ airco ” do sekcji wierszy, aby zobaczyć rzeczywiste wartości.
Mamy w sumie 546 obserwacji. 298 to ani klimatyzacja, ani preferowany obszar, podczas gdy 53 to jedno i drugie i tak dalej.
Utwórzmy dwie tabele i oznaczmy je jako Actual i Expected .
Aby uzyskać oczekiwane wartości ani dla klimatyzacji, ani dla preferowanego obszaru, pomnóż D5 przez B7 , a następnie podziel przez D7 .
Następnie, aby uzyskać oczekiwaną wartość klimatyzacji lub preferowanego obszaru, pomnóż D5 przez C7 , a następnie podziel przez D7 .
Teraz, aby uzyskać oczekiwaną wartość preferowanej powierzchni lub klimatyzacji, pomnóż D6 przez B7 , a następnie podziel przez D7 .
Na koniec obliczmy oczekiwaną wartość zarówno klimatyzacji, jak i preferowanej powierzchni. Pomnóż D6 przez C7 , a następnie podziel przez D7 .
Zaznacz zakres oczekiwanych wartości, aby znaleźć sumę, która powinna wynosić 546.
Teraz znajdziemy związek między wartościami rzeczywistymi a oczekiwanymi. Sprawdźmy, czy w jakiś sposób mają tendencję do poruszania się razem.
Aby znaleźć istotność, wpisz =CHISQ.TEST . Zaznacz zakres rzeczywistych wartości, dodaj przecinek, a następnie zaznacz zakres oczekiwanych wartości, aby uzyskać wartość p .
Biorąc pod uwagę wynik, jest to niewielka szansa losowa. Wydaje się, że istnieje pewien związek między zmienną preferowanego obszaru a zmienną klimatyzacji.
Scalanie zapytań za pomocą Anti Join w Excelu z Power Query
Liczenie odrębnych wartości w Excelu: podejście klasyczne do nowoczesnego
Proporcje i tabele częstotliwości w Excelu
Wniosek
Test chi-kwadrat to powszechna technika, która pomaga nam rozpoznać różnicę według kategorii i jest dobrym przykładem testów A/B.
Kolejną rzeczą do zapamiętania jest to, że obserwacje muszą być niezależne. Opierając się na naszym przykładzie, patrzymy na dwie zmienne binarne, specyficzny typ zmiennej kategorycznej.
Na koniec pamiętajmy, że może to być trudne, gdy mamy wiele kategorii.
Mam nadzieję, że jest to coś, czego możesz użyć do testów A/B, czy to w Excelu , czy Pythonie.
Wszystkiego najlepszego,
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.
W tym samouczku omówiono idee materializacji pamięci podręcznych danych oraz ich wpływ na wydajność języka DAX w dostarczaniu wyników.
Jeśli do tej pory nadal korzystasz z programu Excel, jest to najlepszy moment, aby zacząć korzystać z usługi LuckyTemplates na potrzeby raportowania biznesowego.
Co to jest brama LuckyTemplates? Wszystko co musisz wiedzieć