Cum să subsetez un cadru de date cu una sau mai multe coloane?

Când încercați să înțelegeți un DataFrame mare în Pandas, s-ar putea să fie necesar să îl substabiliți după coloane și rânduri. În acest tutorial, vom arăta cele mai răspândite cazuri de utilizare ale partiționării coloanelor DataFrame.

Vom începe prin a configura exemplul nostru de DataFrame, lucru pe care îl vom face rulând următorul cod Python în mediul nostru preferat (pentru simplitate, folosesc Anaconda și Jupyter Lab).

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

Acum, să ne uităm în primele rânduri ale Dataframe-ului folosind metoda head().

languages.head()

După cum puteți vedea, acesta este un DataFrame destul de simplu pe care îl vom folosi ca exemplu în această postare:

	limba	avg_difficulty_level	salariul_mediu	aplicatii
0	Piton	3	120	10
1	C-Sharp	2	100	15
2	Javascript	2	120	14
3	PHP	1	80	20

Filtrarea unei singure coloane

Vom începe cu cel mai simplu caz, care este să subsetăm o coloană din setul nostru de date. Rularea următoarei comenzi va crea un obiect Series:

După nume/etichetă

languages["language"]

Ieșirea este o serie:

0 Python
1 C-Sharp
2 Javascript
3 PHP
Nume: limba, dtype: obiect

type(languages["language"])

panda.core.series.Series

După index

Următoarea comandă va returna și o serie care conține prima coloană

languages.iloc[:,0]

Selectarea mai multor coloane

Dupa nume

Când trece o listă de coloane, Pandas va returna un DataFrame care conține o parte din date.

languages[["language", "applications"]]

	limba	aplicatii
0	Piton	10
1	C-Sharp	15
2	Javascript	14
3	PHP	20

După etichetă (cu loc)

df.loc[:,["language","applications"]]

Rezultatul va fi similar.

După index

Acum să recuperăm mai multe coloane utilizând indexul:

languages.iloc[: ,[0,3]]

	limba	aplicatii
0	Piton	10
1	C-Sharp	15
2	Javascript	14
3	PHP	20

După condiție

În acest caz, vom afișa doar coloanele care nume se potrivește cu o anumită expresie. Vom folosi metoda de filtrare destul de utilă :

languages.filter(axis = 1, like="avg")

Note:

putem filtra și după o anumită expresie regulată (regex).
Putem aplica parametrul axa=0 pentru a filtra după o anumită valoare a rândului.

Filtrați anumite rânduri în funcție de condiție

Iată o modalitate destul de simplă de a subseta DataFrame în funcție de o valoare de rând:

languages[(languages["applications"] > 15)]

Avem un singur rezultat:

languages[(languages["applications"] > 15)]

	limba	avg_difficulty_level	salariul_mediu	aplicatii
3	PHP	1	80	20

Lasă un comentariu

Despre Rectin: O Soluție Naturală pentru Hemoroizi

Rectin este un gel natural conceput pentru a oferi alinare și a ajuta la gestionarea simptomelor neplăcute ale hemoroizilor, atât interni, cât și externi sau combinați.

7 moduri de a remedia eroarea Blue Screen of Death (BSOD) în Windows 10

Luptă cu eroarea Blue Screen of Death (BSOD) în Windows 10. Obțineți remedieri de depanare pentru a rezolva această eroare cu ușurință.

Cum se creează etichete în aplicația Gmail? Iată tot ce trebuie să știi

Dacă doriți să creați etichete în aplicația Gmail, acest ghid vă oferă soluția. Aflati cum sa faceti acest lucru atât pe telefon, cât și pe desktop.

Cum să adăugați chenar la o pagină în Microsoft Word

Îmbunătățiți-vă documentele cu un chenar de pagină personalizat în Word. Află cum să adăugați și să personalizezi chenarul.

Cum să remediați Xbox nu se conectează la Wi-Fi? [10 soluții rapide]

Dacă Xbox-ul dvs. nu se va conecta la Wi-Fi, urmăriți soluțiile furnizate în acest articol pentru a vă conecta Xbox și a continua să jucați.

REPARAT: PS4 se oprește de la sine Problemă aleatorie [Remediere rapidă]

Dacă PS4 se oprește de la sine, urmați soluțiile noastre eficiente pentru a remedia problema rapid și ușor.

Remediați „Microfonul este dezactivat de setările sistemului Google Meet” [6 trucuri]

Aflați cele mai bune soluții pentru a remedia eroarea „microfonul este dezactivat de setările sistemului” pe Google Meet, Zoom și Hangouts.

Cum să scrieți fracții în Google Docs

$Cum să scrieți fracții în Google Docs$

Descoperiți modalitățile simple și eficiente de a scrie fracții în Google Docs folosind caractere speciale și echivalente automate.

7 Remedieri rapide pentru eroarea ReCaptcha pentru proprietarul site-ului: Tip cheie nevalid

Remedierea eroarei Google ReCaptcha „Eroare pentru proprietarul site-ului: tip cheie invalid” prin soluții eficiente și actualizate.

Cum să calibrați culoarea monitorului în Windows 10

Setările de calibrare a culorilor încorporate în Windows 10 vă ajută să îmbunătățiți acuratețea culorii monitoarelor dvs. Acest ghid detaliat vă arată cum să găsiți și să configurați aceste setări.