Тест хи-квадрат в Excel: сравнение переменных

Тест хи-квадрат в Excel: сравнение переменных

В этом посте мы покажем вам, как использовать тест хи-квадрат в Excel для сравнения переменных. Вы можете посмотреть полное видео этого урока внизу этого блога .

Критерий независимости Хи-квадрат имеет две категориальные переменные. Мы выясним, есть ли какая-либо связь между этими переменными.

Мы будем использовать систему проверки гипотез. Если вы не знакомы с этим, ознакомьтесь с  книгой Advancing Into Analytics  . Это расширенный метод аналитики с использованием Excel , R и Python.

Для нашей демонстрации мы будем использовать набор данных о жилье в Excel. Нам нужно получить фактические значения с помощью сводной таблицы, а затем сравнить их с ожидаемыми значениями с помощью формул.

Мы также проверим уровень значимости 95% и наличие связи между кондиционированием воздуха и предпочтительной зоной.

Оглавление

Использование теста хи-квадрат в Excel для сравнения переменных

Перейдем к Экселю. Это цены на жилье, взятые из Журнала прикладной эконометрики.

Тест хи-квадрат в Excel: сравнение переменных

Вставьте сводную таблицу и нажмите  OK , чтобы использовать индексный столбец для подсчета наблюдений.

Тест хи-квадрат в Excel: сравнение переменных

Из полей сводной таблицы перетащите « id »  в раздел «Значения». Выберите  «Количество»  в настройках поля «Значение», так как это все уникальные значения. 

Затем перетащите « prefarea » в столбцы, а затем перетащите « airco » в разделы «Строки», чтобы увидеть фактические значения.

Всего у нас 546 наблюдений. 298 не имеют ни кондиционера, ни предпочтительной зоны, а 53 — и того, и другого, и так далее.

Тест хи-квадрат в Excel: сравнение переменных

Давайте создадим две таблицы и пометим их как Actual и Expected .

Тест хи-квадрат в Excel: сравнение переменных

Чтобы получить ожидаемые значения ни для кондиционера, ни для предпочтительной зоны, умножьте  D5  на  B7 , а затем разделите на  D7 .

Тест хи-квадрат в Excel: сравнение переменных

Затем, чтобы получить ожидаемое значение либо для кондиционера, либо для предпочтительной площади, умножьте  D5  на  C7 , а затем разделите его на  D7 .

Тест хи-квадрат в Excel: сравнение переменных

Теперь, чтобы получить ожидаемое значение предпочтительной площади или кондиционера, умножьте  D6  на  B7 , а затем разделите его на  D7 .

Тест хи-квадрат в Excel: сравнение переменных

Наконец, давайте вычислим ожидаемую ценность как кондиционера, так и предпочтительной площади. Умножьте  D6  на  C7 , затем разделите на  D7 .

Тест хи-квадрат в Excel: сравнение переменных

Выделите диапазон ожидаемых значений, чтобы узнать сумму, которая должна быть 546.

Тест хи-квадрат в Excel: сравнение переменных

Теперь найдем связь между фактическим и ожидаемым значениями. Давайте проверим, имеют ли они тенденцию двигаться вместе.

Чтобы найти значимость, введите  =CHISQ.TEST . Выделите диапазон фактических значений, добавьте запятую, затем выделите диапазон ожидаемых значений, чтобы получить  p-значение .

Тест хи-квадрат в Excel: сравнение переменных

Судя по результату, это небольшой случайный шанс. По-видимому, существует некоторая взаимосвязь между переменной предпочтительной площади и переменной кондиционирования воздуха.

Тест хи-квадрат в Excel: сравнение переменных


Объединение запросов с использованием антисоединения в Excel с Power Query
Подсчет различных значений в Excel: от классического к современному подходу
Таблицы пропорций и частот в Excel

Заключение

Тест хи-квадрат — это распространенный метод, который помогает нам узнать разницу по категориям и является хорошим примером A/B-тестирования.

Еще одна вещь, которую следует помнить, это то, что наблюдения должны быть независимыми. Основываясь на нашем примере, мы рассматриваем две бинарные переменные, особый тип категориальной переменной.

Наконец, давайте помнить, что это может быть сложно, когда у нас много категорий.

Я надеюсь, что это то, что вы можете использовать для A/B-тестирования, будь то в Excel или Python.

Всего наилучшего,


Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Как сохранить и загрузить файл RDS в R

Как сохранить и загрузить файл RDS в R

Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.

Введение в фильтрацию контекста в LuckyTemplates

Введение в фильтрацию контекста в LuckyTemplates

В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.

Идеи материализации кэшей данных в DAX Studio

Идеи материализации кэшей данных в DAX Studio

В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.

Бизнес-отчетность с использованием LuckyTemplates

Бизнес-отчетность с использованием LuckyTemplates

Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать