Las variables categóricas miden "qué tipo de algo", ya sea el estado de compra del cliente, el país de origen u otra cosa. Para resumir este tipo de variables, podemos contar las frecuencias de cada tipo, comparando cantidades en tablas de frecuencia. Pero a veces ayuda comparar estos valores como porcentajes, y ahí es donde entran en juego las tablas de proporciones. Le mostraré cómo hacer ambas cosas en Excel con la ayuda de las tablas dinámicas, junto con las ventajas y desventajas de comparar cantidades brutas de categorías con sus dimensiones.
Cómo usar tablas de proporción y frecuencia en Excel
Lo primero que voy a hacer es crear una columna de índice. Lo que estoy tratando de hacer aquí es contar, digamos, cuántas de estas casas tienen entrada para auto o no. Y lo que pasa con las tablas dinámicas es que querrán agregar los datos. Y no queremos agregar los datos. Queremos contar el número de observaciones.
Lo otro que voy a hacer, y no es necesario en este caso, pero realmente prefiero e insisto en que mis datos en Excel se mantengan en una tabla. Entonces, voy a hacer clic en Aceptar.
A continuación, podemos cambiar el nombre de la tabla. Llamémoslo Vivienda .
Ahora, voy a insertar una tabla dinámica. Nuestro rango de datos es la vivienda . Ya hay un beneficio. Está muy claro cuáles son nuestros datos de origen, así que pongámoslos en una hoja de trabajo existente.
Entonces, ¿cuántas casas tienen un camino de entrada? Bueno, podemos averiguarlo. Voy a mover " entrada " a Filas, y luego llevaré mi índice a Valores. Voy a ir a la configuración del campo Valores y haré que esto cuente .
Lo que estamos viendo ahora es de 546 casas, 77 no tienen entrada para auto y 469 sí. Esas son nuestras frecuencias.
No necesariamente podemos dividir los síes por los no, pero podemos contar si cada uno es un sí o un no. Entonces, terminamos con este número. Esto se llama tabla de frecuencias unidireccional en Excel porque estamos contando las frecuencias de una manera por una variable.
Ahora hagamos de esto una tabla de frecuencias de doble entrada.
Voy a tomar, digamos, aire acondicionado y arrastrar esto hasta las Columnas. Puede arrastrarlo a las Filas, pero es más común tener su tabla de frecuencia de doble entrada de esta manera, donde tenemos una de las variables en las columnas y otra en las filas.
Si piensas en esto, todavía vemos el 77 y el 469, excepto que lo hemos bifurcado con el aire acondicionado de las casas, no o sí. Entonces, podemos decir que de las 546 casas, tenemos 158 que sí tienen aire acondicionado y entrada para auto, 62 de ellas no tienen ninguno de los dos, y luego tampoco o para esos otros valores.
Esto se llama una tabla de frecuencia de doble entrada, que también se llama tabla de contingencia.
Tenemos 546 casas, pero es difícil saber exactamente qué porcentaje de los valores hay en cada uno de estos cubos, ¿verdad? A menos que seas realmente bueno en el cálculo mental, puede ser difícil dividir 62 entre 546 muy rápidamente y comprender qué porcentaje de cada uno hay en estos cubos.
Entonces, voy a hacer clic en Count of Index , ir a Show Values As , y luego voy a hacer de esto un % de Grand Total .
Al hacer esto, hemos convertido esos valores brutos en porcentajes. Estos números son más fáciles de comprender para nosotros de alguna manera. Esta es una forma más intuitiva de ver los datos.
Tal vez queramos saber qué porcentaje de los registros no tienen un camino de entrada, y qué porcentaje de ellos están en el no y en el sí para el aire acondicionado. Entonces, podríamos cambiar nuestros valores. Lo convertiríamos en un total de filas .
Entonces, estamos cortando cada una de estas filas, averiguando qué porcentaje hay en cada una de ellas.
Una cosa que es difícil con estos porcentajes es que hemos reducido artificialmente los datos. No sabemos 2.7, 5% de lo que sería importante saber. Si es realmente pequeño, si es 2.7, 5% de 120 observaciones, entonces es un número pequeño, ¿no? Si es 2,7, el 5% de mil observaciones, sigue siendo un número considerable.
Nos falta contexto cuando solo miramos las cosas en porcentajes. Entonces, arrastraré mi índice aquí, lo arrastraré dos veces y lo cambiaré como un conteo .
Y ahora, estamos viendo tanto las proporciones como las frecuencias. Incluso podría escribir sobre esto. Hay algo de formato extra que podemos hacer.
Las tablas de frecuencia en Excel y las tablas de proporciones son para variables categóricas. Tenemos que contarlos. No hay otras matemáticas que podamos hacer. Podemos mirar los números en bruto. También podríamos fijarnos en las proporciones.
Espero que aprendas algo sobre las tablas de frecuencias y proporciones y cómo hacerlo en Excel usando esa columna de índice.
Las frecuencias sin procesar nos brindan mucha información sobre los datos porque no los estamos reduciendo artificialmente, pero puede ser difícil comparar la magnitud relativa de cada una de esas cifras. Mientras que, con las tablas de proporciones, es mucho más fácil ver las cosas cuando se dividen en 100. Pero en cierto modo, podemos decir que estamos perdiendo contexto cuando hacemos eso.
Espero que hayas disfrutado este tutorial. Asegúrese de revisar los enlaces a continuación para obtener más contenido relacionado.