Niveles de factores en R: uso de variables categóricas y ordinales

Niveles de factores en R: uso de variables categóricas y ordinales

Este tutorial analizará los factores y los niveles de los factores en R. Aprenderá cómo crear un factor y cómo ajustar los niveles de los factores.

Los factores se utilizan para almacenar y trabajar con variables en R.

En este tutorial, trabajará con variables categóricas y ordinales. Las variables categóricas son variables que involucran una o más categorías que no están ordenadas de ninguna manera específica. Un ejemplo serían los colores. Las variables ordinales , por otro lado, son similares a las variables categóricas con la diferencia de que las variables ordinales tienen un ordenamiento claro de las categorías. Esto podría ser como bajo, medio y alto.

Esta es una introducción a términos más estadísticos. Ahora está explorando lentamente las capacidades de R para datos y análisis estadístico.

Tabla de contenido

Niveles de factores categóricos en R

Si recuerda en otra lección sobre marcos de datos , usó el signo de dólar ( $ ) para imprimir la columna Especie del conjunto de datos del iris . Haga esto de nuevo en RStudio . En la parte más inferior, hay una línea que contiene Niveles compuestos por setosa , versicolor y virginica .

Niveles de factores en R: uso de variables categóricas y ordinales

Esta es la forma en que R maneja las categorías en los datos.

Si usa la función única ( ) , R enumerará los valores únicos en la columna especificada. Por ejemplo, si ejecuta Unique (iris$Species) , la consola muestra los tres niveles de especies de iris.

Niveles de factores en R: uso de variables categóricas y ordinales

No hay un orden inherente para estos niveles. No se puede decir que setosa es mayor que las otras dos categorías de color. R, por defecto, los organiza en orden alfabético.

Niveles de factores ordinales en R

Ahora intentemos explorar los factores con el orden inherente de la categoría.

Cree un vector y asígnele el nombre orders . Para este ejemplo, asigne ese vector con datos utilizando los nombres de tamaño de vaso de Starbucks: alto, venti y grande. Luego, imprímelo.

Niveles de factores en R: uso de variables categóricas y ordinales

Estos deben ordenarse de menor a mayor; debe ser alto, venti y grande. Pero cuando ejecuta la función única ( ) para pedidos , no se organizan en ese orden.

Niveles de factores en R: uso de variables categóricas y ordinales

He aquí cómo convertirlos en variables ordinales. Primero, necesitas crear un nuevo vector. En este caso, el vector se llama new_orders_factor . Asigne este vector con la función factor ( ) . Dentro de esta función, ingrese el vector con el que desea establecer los niveles. Luego, indica los niveles en el orden en que quieres que aparezcan.

Niveles de factores en R: uso de variables categóricas y ordinales

Resalte toda esta línea de código y luego ejecútela. A continuación, se añade un nuevo Valor en Entorno.

Niveles de factores en R: uso de variables categóricas y ordinales

Para comprobar si un vector se ha asignado correctamente como factor, utilice la función is.factor ( ) . Si marca los dos vectores, orders y new_orders_factor , puede ver que el primero devuelve FALSO mientras que el nuevo vector es de hecho un factor.

Niveles de factores en R: uso de variables categóricas y ordinales

Un factor es una forma especial de almacenar una serie de textos. Y aunque es un vector de caracteres, se puede almacenar de una manera que le permite tener un número determinado de categorías que tienen un orden específico de valores o niveles.

Si verifica usando la función de niveles ( ) , puede ver que los niveles ahora están en el orden correcto.

Niveles de factores en R: uso de variables categóricas y ordinales


Crear vectores en R: un tutorial paso a paso
Marcos de datos en R: aprender los conceptos básicos

Conclusión

Aunque esta lección puede parecer esotérica, verá cómo esto marca la diferencia cuando se trata de codificación R más avanzada. Es importante conocer los factores y los niveles, ya que suelen aparecer en muchos análisis estadísticos y de codificación de R.


Time Intelligence en LuckyTemplates: cómo calcular el número de transacciones realizadas en los últimos N días

Time Intelligence en LuckyTemplates: cómo calcular el número de transacciones realizadas en los últimos N días

Descubra cómo calcular el total de transacciones realizadas en los últimos N días y obtenga información útil utilizando la inteligencia de tiempo en LuckyTemplates.

Cómo evaluar clústeres en sus datos mediante la técnica DAX en LuckyTemplates

Cómo evaluar clústeres en sus datos mediante la técnica DAX en LuckyTemplates

En este tutorial, demuestro cómo mostrar clústeres en sus datos permite extraer información valiosa usando técnicas DAX avanzadas.

¿Cuánto personal tenemos actualmente? Lógica de fechas múltiples en LuckyTemplates usando DAX

¿Cuánto personal tenemos actualmente? Lógica de fechas múltiples en LuckyTemplates usando DAX

En este tutorial, aprenderá a calcular la <strong>población actual del personal</strong> para las relaciones múltiples de la tabla de calendario mediante la función COUNTROWS y FILTER en LuckyTemplates.

Hacer una solicitud HTTP en Power Automate

Hacer una solicitud HTTP en Power Automate

Aprenda a crear una solicitud HTTP con Power Automate y cómo implementar soluciones efectivas para la automatización de tareas.

Programe un flujo de escritorio para que se ejecute en Power Automate

Programe un flujo de escritorio para que se ejecute en Power Automate

En este tutorial, aprenda cómo programar un flujo de escritorio en Power Automate para automatizar tareas en la web y su escritorio.

Power Automate Terminar Control de acción en flujos

Power Automate Terminar Control de acción en flujos

Aprenda a usar correctamente el control Terminar acción de Power Automate que termina las acciones en un flujo si no se cumple alguna de las condiciones.

Power Query: combinar archivos de varias carpetas

Power Query: combinar archivos de varias carpetas

Aprenda a combinar archivos de varias carpetas en su red, escritorio, OneDrive o SharePoint utilizando Power Query.

Tipos de flujo de Power Automate y cuándo usarlos

Tipos de flujo de Power Automate y cuándo usarlos

En este blog, analizamos las similitudes y diferencias entre los tipos de flujo de Power Automate y determinamos cuándo usar cada flujo. Encuentra la mejor opción de automatización.

Conectores de Power Automate: número, texto y fecha y hora

Conectores de Power Automate: número, texto y fecha y hora

Familiarízate con algunos conectores Power Automate integrados que transforman cadenas en otro formato: número, texto y fecha y hora.

Tutorial del analizador VertiPaq: relaciones e integridad referencial

Tutorial del analizador VertiPaq: relaciones e integridad referencial

Este tutorial detallado sobre el analizador VertiPaq en DAX Studio le enseñará cómo usar la pestaña Relaciones para optimizar su DAX y resolver problemas de integridad referencial.