Bagaimana cara membuat subset kerangka data dengan satu atau beberapa kolom?

Saat mencoba memahami DataFrame besar di Pandas, Anda mungkin perlu mengelompokkannya dengan kolom dan baris. Dalam tutorial ini kami akan menunjukkan kasus penggunaan yang paling umum dari partisi kolom DataFrame Anda.

Kami akan mulai dengan menyiapkan contoh DataFrame kami, yang akan kami lakukan dengan menjalankan kode Python berikut di lingkungan favorit kami (untuk kesederhanaan, saya menggunakan Anaconda dan Jupyter Lab).

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

Sekarang, mari kita lihat baris pertama Dataframe menggunakan metode head().

languages.head()

Seperti yang Anda lihat, ini adalah DataFrame yang cukup sederhana yang akan kami gunakan sebagai contoh dalam posting ini:

  bahasa rata_tingkat_kesulitan gaji_rata-rata aplikasi
0 Python 3 120 10
1 C-Tajam 2 100 15
2 Javascript 2 120 14
3 PHP 1 80 20

Memfilter satu kolom

Kita akan mulai dengan kasus yang paling sederhana, yaitu mensubset satu kolom dari dataset kita. Menjalankan perintah berikut akan membuat objek Seri:

Dengan nama / label

languages["language"]

Outputnya adalah Seri:

0 Python
1 C-Tajam
2 Javascript
3 PHP
Nama: bahasa, dtype: objek
type(languages["language"])

pandas.core.series.Series

Berdasarkan indeks

Perintah berikut juga akan mengembalikan Seri yang berisi kolom pertama

languages.iloc[:,0]

Memilih beberapa kolom

Dengan nama

Saat melewati daftar kolom, Pandas akan mengembalikan DataFrame yang berisi bagian dari data.

languages[["language", "applications"]]
  bahasa aplikasi
0 Python 10
1 C-Tajam 15
2 Javascript 14
3 PHP 20

Berdasarkan label (dengan lokasi)

df.loc[:,["language","applications"]]

Hasilnya akan serupa.

Berdasarkan indeks

Sekarang mari kita ambil beberapa kolom dengan menggunakan indeks:

languages.iloc[: ,[0,3]]
  bahasa aplikasi
0 Python 10
1 C-Tajam 15
2 Javascript 14
3 PHP 20

Dengan kondisi

Dalam hal ini, kami hanya akan menunjukkan kolom mana yang namanya cocok dengan ekspresi tertentu. Kami akan menggunakan metode filter yang cukup praktis :

languages.filter(axis = 1, like="avg")

Catatan:

  1. kita juga dapat memfilter menurut ekspresi reguler tertentu (regex).
  2. Kita dapat menerapkan parameter axis=0 untuk memfilter berdasarkan nilai baris tertentu.

Filter baris tertentu berdasarkan kondisi

Berikut cara yang cukup mudah untuk mensubset DataFrame menurut nilai baris:

languages[(languages["applications"] > 15)]

Kami hanya memiliki satu hasil:

languages[(languages["applications"] > 15)]
  bahasa rata_tingkat_kesulitan gaji_rata-rata aplikasi
3 PHP 1 80 20

10 situs game teratas yang tidak diblokir di sekolah tahun 2024

10 situs game teratas yang tidak diblokir di sekolah tahun 2024

10 situs web game teratas yang tidak diblokir di sekolah tahun 2024. Temukan dunia game yang tidak diblokir dan nikmati permainan tanpa batasan.

[8 Solusi] Bagaimana Cara Memperbaiki Masalah DNS Pada Windows 10?

[8 Solusi] Bagaimana Cara Memperbaiki Masalah DNS Pada Windows 10?

Mendapatkan masalah DNS di komputer Windows 10? Ikuti perbaikan yang diberikan dalam artikel ini untuk memperbaiki masalah DNS paling umum yang dihadapi pengguna di komputer Windows 10.

7 Perbaikan Untuk Steam Tidak Dapat Menyinkronkan File Anda

7 Perbaikan Untuk Steam Tidak Dapat Menyinkronkan File Anda

Pelajari cara memperbaiki Steam tidak dapat menyinkronkan file Anda. Hapus folder data pengguna, hapus ClientRegistry.blob, verifikasi integritas file game, dan banyak lagi.

Memperbaiki Error Missing or Failed Printhead pada Printer HP [8 Trik]

Memperbaiki Error Missing or Failed Printhead pada Printer HP [8 Trik]

Dapatkan detail lengkap tentang Kesalahan Printhead yang Hilang Atau Gagal. Coba perbaikan terbaik untuk mengatasi HP Officejet hilang atau gagal Printhead error.

Perbaiki URL yang Diminta Ditolak: Silakan Konsultasikan dengan Administrator

Perbaiki URL yang Diminta Ditolak: Silakan Konsultasikan dengan Administrator

Baca artikel untuk memperbaiki URL yang diminta ditolak. Silakan berkonsultasi dengan administrator, kesalahan browser dan buka halaman web yang diperlukan dengan mudah

8 Perbaikan Terbaik untuk Masalah PS5 Tidak Akan Terhubung ke Wi-Fi

8 Perbaikan Terbaik untuk Masalah PS5 Tidak Akan Terhubung ke Wi-Fi

Jika Anda menghadapi masalah PS5 tidak akan terhubung ke Wi-Fi, artikel ini memberikan solusi yang efektif untuk masalah tersebut.

24 Kode Kesalahan Aktivasi Windows 10 Paling Umum dan Perbaikannya [DIPERBARUI]

24 Kode Kesalahan Aktivasi Windows 10 Paling Umum dan Perbaikannya [DIPERBARUI]

Pelajari cara memperbaiki kesalahan aktivasi Windows 10 saat mengaktifkan Windows 10, juga cara membeli kunci produk & memperbaiki kesalahan aktivasi terkait kunci produk sepenuhnya…

Perbaiki PS5 Tidak Dapat Memuat Sesuatu yang Salah dengan 5 Cara Mudah

Perbaiki PS5 Tidak Dapat Memuat Sesuatu yang Salah dengan 5 Cara Mudah

Baca artikel untuk memperbaiki PS5 tidak dapat memuat kesalahan konten. Temukan solusi yang efektif untuk mengatasi masalah ini dengan langkah-langkah yang jelas.

[Memperbaiki] Game Resident Evil 7 Biohazard Crash, Error & Lainnya!

[Memperbaiki] Game Resident Evil 7 Biohazard Crash, Error & Lainnya!

Tidak dapat melakukan Streaming Game Resident Evil 7 kemudian ikuti panduan langkah demi langkah untuk menyelesaikan kesalahan game dan mainkan game tanpa gangguan.

2 Trik Untuk Menghapus Folder $WINDOWS.~BT dan $WINDOWS.~WS Di Windows 10

2 Trik Untuk Menghapus Folder $WINDOWS.~BT dan $WINDOWS.~WS Di Windows 10

Pelajari cara mudah menghapus folder $WINDOWS.~BT dan $WINDOWS.~WS di Windows 10 dengan trik efektif ini. Cobalah sekarang dan optimalkan kinerja PC Anda.