¿Cómo dividir un marco de datos en una o varias columnas?

Cuando intente dar sentido a un DataFrame grande en Pandas, es posible que deba subdividirlo en columnas y filas. En este tutorial, mostraremos los casos de uso más frecuentes de la partición de columnas de su DataFrame.

Comenzaremos configurando nuestro DataFrame de ejemplo, lo que haremos ejecutando el siguiente código de Python en nuestro entorno favorito (para simplificar, uso Anaconda y Jupyter Lab).

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

Ahora, veamos las primeras filas de nuestro Dataframe usando el método head().

languages.head()

Como puede ver, este es un DataFrame bastante simple que usaremos como ejemplo en esta publicación:

	idioma	nivel_de_dificultad_promedio	salario_promedio	aplicaciones
0	Pitón	3	120	10
1	Do sostenido	2	100	15
2	JavaScript	2	120	14
3	PHP	1	80	20

Filtrar una sola columna

Comenzaremos con el caso más simple, que consiste en crear un subconjunto de una columna de nuestro conjunto de datos. Ejecutar el siguiente comando creará un objeto Serie:

Por nombre / etiqueta

languages["language"]

La salida es una Serie:

0 pitón
1 Do sostenido
2 JavaScript
3 PHP
Nombre: idioma, dtype: objeto

type(languages["language"])

pandas.core.series.Series

Por índice

El siguiente comando también devolverá una serie que contiene la primera columna

languages.iloc[:,0]

Selección de varias columnas

Por nombre

Al pasar una lista de columnas, Pandas devolverá un DataFrame que contiene parte de los datos.

languages[["language", "applications"]]

	idioma	aplicaciones
0	Pitón	10
1	Do sostenido	15
2	JavaScript	14
3	PHP	20

Por etiqueta (con loc)

df.loc[:,["language","applications"]]

El resultado será similar.

Por índice

Ahora recuperemos varias columnas usando el índice:

languages.iloc[: ,[0,3]]

	idioma	aplicaciones
0	Pitón	10
1	Do sostenido	15
2	JavaScript	14
3	PHP	20

Por condición

En este caso, solo mostraremos las columnas cuyo nombre coincide con una expresión específica. Usaremos el método de filtro bastante útil:

languages.filter(axis = 1, like="avg")

Notas:

también podemos filtrar por una expresión regular específica (regex).
Podemos aplicar el parámetro axis=0 para filtrar por valor de fila específico.

Filtrar filas específicas por condición

Aquí hay una forma bastante sencilla de dividir el DataFrame en subconjuntos de acuerdo con un valor de fila:

languages[(languages["applications"] > 15)]

Solo tenemos un resultado:

languages[(languages["applications"] > 15)]

	idioma	nivel_de_dificultad_promedio	salario_promedio	aplicaciones
3	PHP	1	80	20

Dejar un comentario

Cómo configurar Outlook para abrir respuestas y reenvíos en una ventana emergente

Aprenda cómo cambiar la configuración en Microsoft Outlook para abrir respuestas y reenvíos en una ventana emergente, mejorando su eficiencia al gestionar correos electrónicos.

7 soluciones sencillas para arreglar Fallout 4 que falla en el problema de la PC

¿Fallout 4 se bloquea al iniciar? ¡¡No es un gran trato!! En este artículo, obtendrá las mejores y más sencillas soluciones que solucionarán el bloqueo de Fallout 4 en la PC.

[CORREGIDO] ¿Cómo arreglar el cambio de avatar de Discord demasiado rápido?

Obteniendo Discord, ¿estás cambiando tu avatar demasiado rápido? Resuelve el error de cambio de avatar en Discord con las soluciones enumeradas en este artículo.

Solucione el error ESRV_SVC_QUEENCREEK en Windows 10/11 [3 CORRECCIONES]

Si se pregunta cómo corregir el error ESRV_SVC_QUEENCREEK en Windows 10/11, siga estas correcciones y soluciones efectivas para resolver el problema.

[Mejores soluciones] Arreglar DS4Windows que no detecta el controlador en Windows 10

¿DS4Windows no detecta el controlador en Windows 10? Aquí hay una solución. Pruebe estas correcciones y comience a usar el controlador con su juego de PC favorito.

[CORREGIDO] Errores de Rise of the Tomb Raider, fallas, caída de FPS, NTDLL, error al iniciar y más

Obtener errores de Rise of the Tomb Raider como bloqueos, congelamiento, FPS bajo y otros, luego siga las correcciones dadas una por una para jugar el juego fácilmente...

Cómo hacer que la semana del calendario comience con el lunes (EXPLICACIÓN)

Para configurar su calendario para que comience la semana con el lunes, debe buscar en la configuración del calendario. La opción suele estar a un par de toques/clics de distancia.

Cómo exportar mensajes de chat de Discord

Discord ofrece un historial de mensajes ilimitado, pero si desea exportar sus mensajes, deberá utilizar una solución alternativa. Así es cómo.

[Solucionado] El controlador WudfRd no pudo cargar el error 219 en Windows 10

Si encuentra que el Driver WudfRd no pudo cargar el error con un ID de evento 219 en Windows 10, siga las correcciones que se proporcionan aquí y resuelva el error 219 de manera efectiva.

Error de instalación detenida en Xbox One [11 formas principales]

Recibir el error de detención de la instalación de Xbox One al intentar instalar juegos, luego sigue las correcciones y resuelve el error de instalación detenida en Xbox One.