Bagaimana untuk mensubset kerangka data dengan satu atau berbilang lajur?

Apabila cuba memahami DataFrame yang besar dalam Pandas, anda mungkin perlu mensubsetkannya mengikut lajur dan baris. Dalam tutorial ini kami akan menunjukkan kes penggunaan yang paling lazim bagi pembahagian lajur DataFrame anda.

Kami akan mulakan dengan menyediakan contoh DataFrame kami, yang akan kami lakukan dengan menjalankan kod Python berikut dalam persekitaran kegemaran kami (untuk memudahkan, saya menggunakan Anaconda dan Jupyter Lab).

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

Sekarang, mari kita lihat baris pertama Bingkai Data kami menggunakan kaedah head().

languages.head()

Seperti yang anda lihat, ini adalah DataFrame yang cukup mudah yang akan kami gunakan sebagai contoh dalam siaran ini:

	bahasa	purata_tahap_kesukaran	purata_gaji	aplikasi
0	Ular sawa	3	120	10
1	C-Sharp	2	100	15
2	Javascript	2	120	14
3	PHP	1	80	20

Menapis satu lajur

Kami akan mulakan dengan kes yang paling mudah, iaitu subset satu lajur daripada set data kami. Menjalankan arahan berikut akan mencipta objek Siri:

Mengikut nama / label

languages["language"]

Outputnya ialah Siri:

0 Python
1 C-Sharp
2 Javascript
3 PHP
Nama: bahasa, dtype: objek

type(languages["language"])

panda.core.series.Series

Mengikut indeks

Perintah berikut juga akan mengembalikan Siri yang mengandungi lajur pertama

languages.iloc[:,0]

Memilih berbilang lajur

Dengan nama

Apabila menghantar senarai lajur, Pandas akan mengembalikan DataFrame yang mengandungi sebahagian daripada data.

languages[["language", "applications"]]

	bahasa	aplikasi
0	Ular sawa	10
1	C-Sharp	15
2	Javascript	14
3	PHP	20

Mengikut label (dengan lokasi)

df.loc[:,["language","applications"]]

Hasilnya akan serupa.

Mengikut indeks

Sekarang mari kita dapatkan berbilang lajur dengan menggunakan indeks:

languages.iloc[: ,[0,3]]

	bahasa	aplikasi
0	Ular sawa	10
1	C-Sharp	15
2	Javascript	14
3	PHP	20

Dengan syarat

Dalam kes ini, kami hanya akan menunjukkan lajur nama yang sepadan dengan ungkapan tertentu. Kami akan menggunakan kaedah penapis yang agak berguna :

languages.filter(axis = 1, like="avg")

Nota:

kita juga boleh menapis mengikut ungkapan biasa tertentu (regex).
Kita boleh menggunakan paksi parameter=0 untuk menapis mengikut nilai baris tertentu.

Tapis baris tertentu mengikut syarat

Berikut ialah cara yang agak mudah untuk mensubsetkan DataFrame mengikut nilai baris:

languages[(languages["applications"] > 15)]

Kami hanya mempunyai satu hasil:

languages[(languages["applications"] > 15)]

	bahasa	purata_tahap_kesukaran	purata_gaji	aplikasi
3	PHP	1	80	20

Tinggalkan Komen

Cara menukar Chromebook akaun utama

Untuk menukar akaun utama pada Chromebook anda, log masuk dengan akaun utama dan gunakan Powerwash untuk tetapan semula kilang peranti. Pelajari langkah-langkah yang mudah untuk proses ini.

Nota Google Keep hilang? Inilah cara untuk mendapatkan mereka kembali

Jika nota Google Keep hilang, semak arkib, sampah dan pastikan anda menyegerakkan semula dan menggunakan Akaun Google yang betul.

Apakah Maksud TTB dan Bagaimana Saya Menggunakannya?

Singkatan internet TTB mempunyai lebih daripada satu makna tetapi terdapat satu yang digunakan terutamanya untuknya. Inilah pandangan tentang bagaimana cara anda harus menggunakannya.

Bagaimana Untuk Selesaikan Masalah Lampu Merah Pengawal PS4? [Penyelesaian Dicuba & Diuji]

Adakah anda sedang mencari penyelesaian pantas untuk menyelesaikan masalah lampu merah pengawal PS4? Kemudian cuba penyelesaian yang diberikan dan betulkan lampu merah pada PS4...

Cara Mengira Tahun Perkhidmatan dalam Excel

Ketahui cara mengira tahun perkhidmatan dalam Excel untuk memudahkan pengurusan pekerja dan manfaatkan fungsi-fungsi berguna seperti YEARFRAC dan DATEDIF.

Halia 2.7.53.0

Halia ialah penyemak ejaan dan tatabahasa percuma.

Blok

Blocks ialah permainan intelektual untuk pelajar sekolah rendah gred 3 untuk mempraktikkan kemahiran pengesanan dan mata mereka dan disertakan oleh guru dalam program sokongan pengajaran IT.

Prezi 6.26

Prezi ialah aplikasi percuma yang membolehkan anda membuat persembahan digital, dalam talian dan luar talian.

Mathway

Mathway ialah apl yang sangat berguna yang boleh membantu anda menyelesaikan semua masalah matematik yang memerlukan alat yang lebih kompleks daripada kalkulator terbina dalam peranti anda.

Adobe Presenter

Adobe Presenter ialah perisian e-Pembelajaran yang dikeluarkan oleh Adobe Systems yang tersedia pada platform Microsoft Windows sebagai pemalam Microsoft PowerPoint.