Comment sous-ensemble un dataframe par une ou plusieurs colonnes ?

Lorsque vous essayez de donner un sens à un grand DataFrame dans Pandas, vous devrez peut-être le sous-ensemble par colonnes et lignes. Dans ce didacticiel, nous allons montrer les cas d'utilisation les plus courants du partitionnement de colonnes de votre DataFrame.

Nous allons commencer par configurer notre exemple DataFrame, ce que nous ferons en exécutant le code Python suivant dans notre environnement préféré (pour plus de simplicité, j'utilise Anaconda et Jupyter Lab).

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

Maintenant, examinons nos premières lignes Dataframe en utilisant la méthode head().

languages.head()

Comme vous pouvez le constater, il s'agit d'un DataFrame assez simple que nous utiliserons comme exemple dans cet article :

  Langue avg_difficulty_level avg_salary applications
0 Python 3 120 dix
1 do dièse 2 100 15
2 Javascript 2 120 14
3 PHP 1 80 20

Filtrer une seule colonne

Nous allons commencer par le cas le plus simple, qui consiste à créer un sous-ensemble d'une colonne de notre ensemble de données. L'exécution de la commande suivante créera un objet Series :

Par nom / étiquette

languages["language"]

La sortie est une série :

0Python
1 do dièse
2 Javascript
3 PHP
Nom : langage, dtype : objet
type(languages["language"])

pandas.core.series.Series

Par indice

La commande suivante renverra également une série contenant la première colonne

languages.iloc[:,0]

Sélection de plusieurs colonnes

De nom

Lors du passage d'une liste de colonnes, Pandas renverra un DataFrame contenant une partie des données.

languages[["language", "applications"]]
  Langue applications
0 Python dix
1 do dièse 15
2 Javascript 14
3 PHP 20

Par étiquette (avec loc)

df.loc[:,["language","applications"]]

Le résultat sera similaire.

Par indice

Récupérons maintenant plusieurs colonnes en utilisant l'index :

languages.iloc[: ,[0,3]]
  Langue applications
0 Python dix
1 do dièse 15
2 Javascript 14
3 PHP 20

Par condition

Dans ce cas, nous allons simplement afficher les colonnes dont le nom correspond à une expression spécifique. Nous allons utiliser la méthode de filtrage assez pratique :

languages.filter(axis = 1, like="avg")

Remarques:

  1. nous pouvons également filtrer par une expression régulière spécifique (regex).
  2. Nous pouvons appliquer le paramètre axis=0 pour filtrer par valeur de ligne spécifique.

Filtrer des lignes spécifiques par condition

Voici un moyen assez simple de créer un sous-ensemble du DataFrame en fonction d'une valeur de ligne :

languages[(languages["applications"] > 15)]

Nous n'avons qu'un seul résultat :

languages[(languages["applications"] > 15)]
  Langue avg_difficulty_level avg_salary applications
3 PHP 1 80 20

Correction : le solde Google Play continue dêtre refusé

Correction : le solde Google Play continue dêtre refusé

Si le solde Google Play continue d

[RESOLU] Comment corriger lerreur Hulu 94 sur Windows 10 et Xbox One ?

[RESOLU] Comment corriger lerreur Hulu 94 sur Windows 10 et Xbox One ?

Résolvez l’erreur 94 Échec du chargement de Hulu sur un PC Windows 10 ou une Xbox One grâce à nos solutions efficaces pour corriger le code d

[7 solutions testées] Correction du code derreur 0xc000017 sur Windows 10

[7 solutions testées] Correction du code derreur 0xc000017 sur Windows 10

Apprenez à corriger le code d

Comment insérer des images, des fichiers et des vidéos dans Microsoft OneNote

Comment insérer des images, des fichiers et des vidéos dans Microsoft OneNote

Si vous avez une image, une vidéo ou un fichier qui accompagne une note, apprenez à les insérer facilement dans OneNote grâce à notre guide étape par étape !

[RÉSOLU] Comment réparer Discord en changeant davatar trop rapidement ?

[RÉSOLU] Comment réparer Discord en changeant davatar trop rapidement ?

Obtenez des solutions pour corriger l

Comment citer des sources et inclure une bibliographie dans Google Docs

Comment citer des sources et inclure une bibliographie dans Google Docs

Apprenez à citer des sources et à créer une bibliographie dans Google Docs de manière efficace. Suivez ces étapes simples pour améliorer la qualité de vos travaux.

CORRIGÉ : Erreur de VIOLATION DE LICENCE SYSTÈME dans Windows 10 [10 CORRECTIONS FACILES]

CORRIGÉ : Erreur de VIOLATION DE LICENCE SYSTÈME dans Windows 10 [10 CORRECTIONS FACILES]

Suivez ici tous les correctifs possibles pour résoudre l

Correctif : « Les fonctionnalités de jeu ne sont pas disponibles pour le bureau Windows »

Correctif : « Les fonctionnalités de jeu ne sont pas disponibles pour le bureau Windows »

Résolvez le problème lorsque les fonctionnalités de jeu ne sont pas disponibles pour le bureau Windows ou l

Comment exporter des messages de chat Discord

Comment exporter des messages de chat Discord

Découvrez comment exporter vos messages de chat Discord. Apprenez les meilleures méthodes, y compris l

Correction de lerreur Tête dimpression manquante ou défaillante sur les imprimantes HP [8 astuces]

Correction de lerreur Tête dimpression manquante ou défaillante sur les imprimantes HP [8 astuces]

Obtenez des détails complets sur l'erreur de tête d'impression manquante ou défaillante. Essayez les meilleurs correctifs pour résoudre l'erreur de tête d'impression manquante ou en échec de HP Officejet.