Что такое self в Python: примеры из реального мира
Что такое self в Python: примеры из реального мира
В этом посте мы покажем вам, как использовать тест хи-квадрат в Excel для сравнения переменных. Вы можете посмотреть полное видео этого урока внизу этого блога .
Критерий независимости Хи-квадрат имеет две категориальные переменные. Мы выясним, есть ли какая-либо связь между этими переменными.
Мы будем использовать систему проверки гипотез. Если вы не знакомы с этим, ознакомьтесь с книгой Advancing Into Analytics . Это расширенный метод аналитики с использованием Excel , R и Python.
Для нашей демонстрации мы будем использовать набор данных о жилье в Excel. Нам нужно получить фактические значения с помощью сводной таблицы, а затем сравнить их с ожидаемыми значениями с помощью формул.
Мы также проверим уровень значимости 95% и наличие связи между кондиционированием воздуха и предпочтительной зоной.
Оглавление
Использование теста хи-квадрат в Excel для сравнения переменных
Перейдем к Экселю. Это цены на жилье, взятые из Журнала прикладной эконометрики.
Вставьте сводную таблицу и нажмите OK , чтобы использовать индексный столбец для подсчета наблюдений.
Из полей сводной таблицы перетащите « id » в раздел «Значения». Выберите «Количество» в настройках поля «Значение», так как это все уникальные значения.
Затем перетащите « prefarea » в столбцы, а затем перетащите « airco » в разделы «Строки», чтобы увидеть фактические значения.
Всего у нас 546 наблюдений. 298 не имеют ни кондиционера, ни предпочтительной зоны, а 53 — и того, и другого, и так далее.
Давайте создадим две таблицы и пометим их как Actual и Expected .
Чтобы получить ожидаемые значения ни для кондиционера, ни для предпочтительной зоны, умножьте D5 на B7 , а затем разделите на D7 .
Затем, чтобы получить ожидаемое значение либо для кондиционера, либо для предпочтительной площади, умножьте D5 на C7 , а затем разделите его на D7 .
Теперь, чтобы получить ожидаемое значение предпочтительной площади или кондиционера, умножьте D6 на B7 , а затем разделите его на D7 .
Наконец, давайте вычислим ожидаемую ценность как кондиционера, так и предпочтительной площади. Умножьте D6 на C7 , затем разделите на D7 .
Выделите диапазон ожидаемых значений, чтобы узнать сумму, которая должна быть 546.
Теперь найдем связь между фактическим и ожидаемым значениями. Давайте проверим, имеют ли они тенденцию двигаться вместе.
Чтобы найти значимость, введите =CHISQ.TEST . Выделите диапазон фактических значений, добавьте запятую, затем выделите диапазон ожидаемых значений, чтобы получить p-значение .
Судя по результату, это небольшой случайный шанс. По-видимому, существует некоторая взаимосвязь между переменной предпочтительной площади и переменной кондиционирования воздуха.
Объединение запросов с использованием антисоединения в Excel с Power Query
Подсчет различных значений в Excel: от классического к современному подходу
Таблицы пропорций и частот в Excel
Заключение
Тест хи-квадрат — это распространенный метод, который помогает нам узнать разницу по категориям и является хорошим примером A/B-тестирования.
Еще одна вещь, которую следует помнить, это то, что наблюдения должны быть независимыми. Основываясь на нашем примере, мы рассматриваем две бинарные переменные, особый тип категориальной переменной.
Наконец, давайте помнить, что это может быть сложно, когда у нас много категорий.
Я надеюсь, что это то, что вы можете использовать для A/B-тестирования, будь то в Excel или Python.
Всего наилучшего,
Что такое self в Python: примеры из реального мира
Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.
В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.
В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.
В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.
Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.
Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.
В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.
Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.
Что такое шлюз LuckyTemplates? Все, что тебе нужно знать