Como subconjunto um dataframe por uma ou várias colunas?

Ao tentar entender um grande DataFrame no Pandas, talvez seja necessário subconjunto por colunas e linhas. Neste tutorial, mostraremos os casos de uso mais comuns de particionamento de colunas do seu DataFrame.

Começaremos configurando nosso DataFrame de exemplo, o que faremos executando o seguinte código Python em nosso ambiente favorito (para simplificar, uso Anaconda e Jupyter Lab).

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

Agora, vamos examinar nossas primeiras linhas do Dataframe usando o método head().

languages.head()

Como você pode ver, este é um DataFrame bem simples que usaremos como exemplo neste post:

	língua	avg_difficulty_level	salário_médio	formulários
0	Pitão	3	120	10
1	C Sustenido	2	100	15
2	Javascript	2	120	14
3	PHP	1	80	20

Filtrando uma única coluna

Começaremos com o caso mais simples, que é subconjunto de uma coluna do nosso conjunto de dados. A execução do seguinte comando criará um objeto Series:

Por nome/etiqueta

languages["language"]

A saída é uma série:

0 Python
1 C Sustenido
2 Javascript
3 PHP
Nome: idioma, dtype: objeto

type(languages["language"])

pandas.core.series.Series

Por índice

O comando a seguir também retornará uma série contendo a primeira coluna

languages.iloc[:,0]

Selecionando várias colunas

Por nome

Ao passar uma lista de colunas, o Pandas retornará um DataFrame contendo parte dos dados.

languages[["language", "applications"]]

	língua	formulários
0	Pitão	10
1	C Sustenido	15
2	Javascript	14
3	PHP	20

Por rótulo (com loc)

df.loc[:,["language","applications"]]

O resultado será semelhante.

Por índice

Agora vamos recuperar várias colunas usando o índice:

languages.iloc[: ,[0,3]]

	língua	formulários
0	Pitão	10
1	C Sustenido	15
2	Javascript	14
3	PHP	20

Por condição

Nesse caso, mostraremos apenas as colunas cujo nome corresponde a uma expressão específica. Usaremos o método de filtro bastante útil :

languages.filter(axis = 1, like="avg")

Notas:

também podemos filtrar por uma expressão regular específica (regex).
Podemos aplicar o parâmetro axis=0 para filtrar por valor de linha específico.

Filtrar linhas específicas por condição

Aqui está uma maneira bastante direta de subconjunto do DataFrame de acordo com um valor de linha:

languages[(languages["applications"] > 15)]

Temos apenas um resultado:

languages[(languages["applications"] > 15)]

	língua	avg_difficulty_level	salário_médio	formulários
3	PHP	1	80	20

Deixar um comentário

Como corrigir o código de erro NVIDIA GeForce Experience 0x0003 no Windows 10?

Cansado de corrigir o código de erro 0x0003 da Nvidia Geforce Experience no PC com Windows 10 e nada está funcionando? Em seguida, siga as correções fáceis fornecidas neste artigo.

Corrigir NOX Player sem som Windows 10 com 9 soluções rápidas

Você está enfrentando NOX Player No Sound Issue enquanto joga seu jogo favorito? Em seguida, leia este guia detalhado e resolva o problema.

[RESOLVIDO] Erros do Call of Duty Advanced Warfare - travando, travando, FPS baixo e mais

Aprenda a solucionar vários erros do Call of Duty Advanced Warfare, como travamentos, gagueira e FPS baixo para uma experiência de jogo otimizada.

Como corrigir um erro de falha ao carregar Steamui.dll no Steam

Um erro fatal "falha ao carregar steamui.dll" no Steam pode ser corrigido. Confira as soluções eficazes para resolver este problema.

Como corrigir o erro 3000 do Twitch? [100% resolvido]

Obtendo o Twitch Error 3000 no Chrome, siga as soluções fornecidas e comece a vaporizar o Twitch sem o erro de decodificação do recurso 3000 Media.

[RESOLVIDO] Erros do American Truck Simulator: Crash, Steam_Api64.Dll está ausente e mais

Quer CORRIGIR ERROS DO AMERICAN TRUCK SIMULATOR: CRASH, LOW FPS, STEAM_API64.DLL ESTÁ FALTANDO PROBLEMA e MAIS, então siga as soluções fornecidas com cuidado.

Desempenho lento do Microsoft Word? Sete dicas para tornar o Word 365 / 2019 / 2016 muito mais rápido

Saiba como você pode facilmente tornar o Word 365 mais rápido ao desabilitar suplementos, atualizar seu hardware e se livrar de arquivos temporários.

[RESOLVIDO] Como corrigir League Of Legends d3dx9_39.dll ausente, erro DirectX

Aprenda a corrigir erros d3dx9_39.dll e DirectX em League Of Legends. Siga as soluções fornecidas para resolver erros DirectX ausentes d3dx9_39.dll.

Como corrigir o problema do controlador PS5 não conecta/não sincroniza?

Se o controlador PS5 não se conectar ou não sincronizar, experimente estas soluções testadas e comprovadas para corrigir esses problemas de conexão.

Como corrigir NTLDR está faltando erro no Windows 10/8/7?

Saiba como solucionar o erro "NTLDR está faltando" no Windows com as soluções mais eficientes. Conheça também o que causa o erro NTLDR e outras informações relevantes.