Уровни факторов в R: использование категориальных и порядковых переменных

Уровни факторов в R: использование категориальных и порядковых переменных

В этом руководстве рассматриваются факторы и уровни факторов в R. Вы узнаете, как создать фактор и как настроить уровни факторов.

Факторы используются для хранения и работы с переменными в R.

В этом уроке вы будете иметь дело с категориальными и порядковыми переменными. Категориальные переменные — это переменные, включающие одну или несколько категорий, которые не упорядочены каким-либо определенным образом. Примером могут служить цвета. Порядковые переменные , с другой стороны, похожи на категориальные переменные с той разницей, что порядковые переменные имеют четкий порядок категорий. Это может быть низкий, средний и высокий уровень.

Это введение в дополнительные статистические термины. Теперь вы медленно изучаете возможности R для данных и статистического анализа.

Оглавление

Уровни категориальных факторов в R

Если вы помните, в другом уроке о фреймах данных вы использовали знак доллара ( $ ) для вывода столбца Species из набора данных iris . Сделайте это снова в RStudio . В самой нижней части есть строка, содержащая уровни, состоящие из setosa , versicolor и virginica .

Уровни факторов в R: использование категориальных и порядковых переменных

Это способ обработки категорий данных в R.

Если вы используете функцию unique ( ) , R выведет список уникальных значений в указанном столбце. Например, если вы запустили unique (iris$Species) , в консоли отобразится уровень трех видов радужной оболочки.

Уровни факторов в R: использование категориальных и порядковых переменных

Для этих уровней нет внутреннего порядка. Вы не можете сказать, что setosa больше, чем две другие цветовые категории. R по умолчанию упорядочивает их в алфавитном порядке.

Уровни порядкового коэффициента в R

Теперь давайте попробуем изучить факторы с присущим порядком категории.

Создайте вектор и назовите его orders . В этом примере присвойте этому вектору данные, используя названия размеров чашек Starbucks: высокий, венти и большой. Затем распечатайте его.

Уровни факторов в R: использование категориальных и порядковых переменных

Они должны быть расположены от меньшего к большему; он должен быть высоким, венти и гранде. Но когда вы запускаете функцию unique() для заказов , они не располагаются в таком порядке.

Уровни факторов в R: использование категориальных и порядковых переменных

Вот как превратить их в порядковые переменные. Во-первых, вам нужно создать новый вектор. В этом случае вектор называется new_orders_factor . Присвойте этому вектору функцию factor ( ) . Внутри этой функции введите вектор, с которым вы хотите установить уровни. Затем укажите уровни в том порядке, в котором вы хотите, чтобы они отображались.

Уровни факторов в R: использование категориальных и порядковых переменных

Выделите всю эту строку кода, а затем запустите ее. Затем в Environment добавляется новое значение.

Уровни факторов в R: использование категориальных и порядковых переменных

Чтобы проверить, правильно ли вектор назначен в качестве фактора, используйте функцию is.factor() . Если вы проверите два вектора, orders и new_orders_factor , вы увидите, что первый возвращает FALSE, а новый вектор действительно является фактором.

Уровни факторов в R: использование категориальных и порядковых переменных

Фактор — это особый способ хранения последовательности текстов. И хотя это вектор символов, его можно хранить таким образом, чтобы он имел заданное количество категорий с определенным порядком значений или уровней.

Если вы проверите с помощью функции уровней ( ) , вы увидите, что уровни теперь расположены в правильном порядке.

Уровни факторов в R: использование категориальных и порядковых переменных


Создание векторов в R: пошаговое руководство
Фреймы данных в R: изучение основ

Заключение

Хотя этот урок может показаться эзотерическим, вы увидите, насколько это важно при работе с более сложным R-кодированием. Важно знать о факторах и уровнях, поскольку они часто встречаются во многих кодах R и статистическом анализе.


Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Как сохранить и загрузить файл RDS в R

Как сохранить и загрузить файл RDS в R

Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.

Введение в фильтрацию контекста в LuckyTemplates

Введение в фильтрацию контекста в LuckyTemplates

В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.

Идеи материализации кэшей данных в DAX Studio

Идеи материализации кэшей данных в DAX Studio

В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.

Бизнес-отчетность с использованием LuckyTemplates

Бизнес-отчетность с использованием LuckyTemplates

Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать