Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Pandas ialah perpustakaan Python yang digunakan secara meluas untuk manipulasi dan analisis data. Satu fungsi penting yang boleh diberikan oleh panda kepada anda ialah keupayaan untuk mengubah suai struktur set data. Khususnya, menjatuhkan indeks dalam DataFrame ialah operasi penting apabila bekerja dengan set data. Ia membolehkan anda mengalih keluar baris atau lajur yang tidak diingini daripada data.

Untuk menggugurkan indeks dengan panda, anda boleh menggunakan kaedah .drop() dan .reset_index(). Kaedah .drop() membolehkan anda mengalih keluar baris atau lajur tertentu. Sebaliknya, kaedah .reset_index() membolehkan anda mengalih keluar indeks dan menetapkannya semula kepada RangeIndex lalai.

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Dalam artikel ini, kita akan membincangkan penggunaan kaedah ini untuk menjatuhkan indeks dalam DataFrames panda. Kami akan meneliti pelbagai contoh untuk menunjukkan cara memanipulasi struktur set data dengan berkesan untuk memenuhi keperluan analisis yang berbeza. Melalui contoh ini, anda akan mendapat pemahaman yang lebih mendalam tentang cara perpustakaan panda boleh digunakan untuk manipulasi data.

Mari kita masuk ke dalamnya!

Isi kandungan

Memahami Pandas Drop Index

Sebelum kita menyelami penurunan indeks dengan panda, adalah sangat penting untuk anda memahami apa itu DataFrame panda. Tambahan pula, anda juga harus biasa dengan konsep indeks dan lajur dalam DataFrame panda.

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Dalam bahagian ini, kami akan merangkumi asas DataFrame, indeks dan lajur panda. Kami kemudian akan melihat contoh menjatuhkan indeks menggunakan panda.

1. Apakah Bingkai Data Pandas?

Pandas ialah perpustakaan Python sumber terbuka yang menyediakan alat manipulasi dan analisis data berprestasi tinggi. Salah satu struktur data utamanya ialah DataFrame .

DataFrame panda ialah struktur data dua dimensi dengan paksi berlabel (baris dan lajur). Anda boleh menganggap DataFrame sebagai perwakilan objek Pythonic bagi jadual SQL atau hamparan Excel.

Berikut ialah DataFrame panda biasa:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

2. Apakah Indeks dan Lajur?

Dalam DataFrame panda, Indeks berfungsi sebagai 'alamat' untuk titik data. Ia menyediakan cara untuk mengakses dan mengatur data merentas DataFrame. Ia boleh jadi sama ada jujukan integer lalai yang diberikan oleh panda atau indeks tersuai yang ditentukan pengguna.

Lajur ialah pembolehubah yang mengehoskan pelbagai jenis data dalam DataFrame. Setiap lajur pada asasnya adalah satu siri data. Ia boleh menyimpan pelbagai jenis data seperti integer, terapung atau rentetan. Label lajur, biasanya dirujuk sebagai nama lajur, mengenal pasti siri data ini.

Dalam DataFrame panda, manipulasi data selalunya melibatkan kerja dengan label baris (indeks) atau label lajur.

Beberapa operasi biasa yang boleh anda lakukan dengan DataFrame berbilang indeks termasuk memilih, menamakan semula dan menjatuhkan baris atau lajur berdasarkan labelnya.

3. Cara Menggugurkan Lajur Indeks dengan Panda

Dalam panda, anda boleh menggunakan kaedah DataFrame reset_index() untuk menggugurkan dan menetapkan semula indeks.

Katakan kita mempunyai DataFrame berikut:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Untuk menjatuhkan lajur indeks, kita boleh menggunakan kod berikut:

df.reset_index(drop=True)

Selepas menjalankan kod ini, anda akan mendapat contoh di bawah:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Dalam output, anda boleh melihat bahawa indeks digugurkan dan digantikan dengan nilai indeks asal.

Anda juga boleh menggunakan kaedah drop dalam panda untuk mengalih keluar label tertentu daripada baris atau lajur.

Sintaks untuk kaedah ini ialah:

DataFrame.drop(labels=None, *, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')

Berikut ialah parameter utama kaedah drop :

  • labels : Label untuk dialih keluar. Ia boleh sama ada baris atau lajur bergantung pada parameter paksi .

  • paksi : Menentukan sama ada untuk menggugurkan daripada baris ( 0 atau 'indeks' ) atau lajur ( 1 atau 'lajur' ).

  • indeks : Alternatif untuk menentukan paksi=0 . Membenarkan menandakan label baris untuk dialih keluar.

  • lajur : Alternatif untuk menentukan paksi=1 . Membenarkan menandakan label lajur untuk dialih keluar.

  • inplace : Jika ditetapkan kepada True , operasi akan dilakukan di tempatnya, bermakna DataFrame asal akan diubah suai. Jika Salah (lalai), DataFrame baharu dengan label yang ditentukan dialih keluar akan dikembalikan.

  • ralat : Mengawal cara mengendalikan label yang hilang. Jika 'naikkan' (lalai), ralat akan dibangkitkan apabila label tidak ditemui. Jika 'memaksa' , label yang hilang akan diabaikan secara senyap.

Katakan kita mempunyai DataFrame berikut:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Kami ingin menggugurkan baris dengan indeks 1. Untuk melakukan ini menggunakan kaedah drop, anda boleh menulis kod berikut, bermula dengan import panda:

import pandas as pd

# Drop row with index 1
df.drop(1, axis=0)

Argumen paksi =0 bagi fungsi drop memberitahu penterjemah bahawa kami sedang melaksanakan operasi mengikut baris. Argumen kedua 1 ialah indeks baris. Ia memberitahu jurubahasa untuk menggugurkan baris dengan indeks 1.

Selepas operasi di atas, kami mendapat DataFrame berikut:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Sekarang, katakan kami ingin menggugurkan lajur dengan Umur sebagai pengepala lajur daripada DataFrame kami. Untuk mencapai ini, kita boleh menulis kod berikut:

# Drop column 'Age'
df.drop('Age', axis=1)

Paksi hujah =1 memberitahu penterjemah bahawa kami sedang menjalankan operasi mengikut lajur. Hujah 'Umur' memberitahu jurubahasa untuk menggugurkan lajur dengan nama 'Umur'.

Selepas menjalankan kod di atas, anda akan mendapat DataFrame berikut:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Cara Menggugurkan Berbilang Baris dan Lajur

Contoh di atas menunjukkan menjatuhkan satu baris atau lajur. Bagaimana jika anda ingin melepaskan berbilang baris atau lajur?

Untuk mencapai ini, kami akan menggunakan kod yang sama dengan sedikit perubahan. Daripada menggunakan satu nilai, kami boleh menyediakan senarai argumen kepada fungsi drop untuk mengalih keluar berbilang baris dan lajur sekaligus.

Katakan saya mahu melepaskan 2 baris pertama dalam DataFrame kami. Untuk mencapai ini, kita boleh menggunakan kod berikut:

# Dropping first 2 rows by index
df = df.drop([0, 1], axis=0)

Dalam kod ini, kami memberitahu jurubahasa untuk menggugurkan baris 0 dan 1. Output kod ini diberikan di bawah:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Anda boleh melihat bahawa baris 0 dan 1 tidak lagi dalam DataFrame.

Jom kita gugurkan juga ruangan Jabatan dan Gaji. Untuk melakukan ini, kita boleh menggunakan kod berikut:

# Dropping columns by name
df = df.drop(['Salary', 'Department'], axis=1)

Dalam skrip Python ini , kami meminta jurubahasa untuk menggugurkan lajur dengan Gaji dan Jabatan sebagai pengepala lajur. Output kod ini diberikan di bawah:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Ini adalah DataFrame terakhir kami. Secara keseluruhan, kami memadamkan dua baris dan dua lajur daripada DataFrame kami menggunakan kaedah drop.

Untuk mengetahui lebih lanjut tentang MultiIndex dalam panda, lihat video berikut:

Cara Menggugurkan Baris dan Lajur dengan Inplace

Dalam contoh sebelumnya, anda boleh melihat bahawa kami mula-mula membuat perubahan pada DataFrame dan kemudian menyimpannya sebagai DataFrame baharu. Walau bagaimanapun, ini bukan cara yang cekap untuk menjatuhkan baris dan lajur.

Alternatif lain untuk menggugurkan baris dan lajur adalah untuk menetapkan argumen inplace fungsi drop kepada True .

Dengan menetapkan parameter inplace kepada True , anda boleh mengubah suai DataFrame secara kekal tanpa perlu menetapkannya semula.

Ini berguna apabila berurusan dengan DataFrame yang besar, kerana ia boleh menjimatkan memori dengan mengelakkan penciptaan DataFrame baharu.

Berikut ialah contoh menjatuhkan baris dan lajur dengan inplace :

# Dropping rows by index inplace
df.drop(labels=[0, 1], axis=0, inplace=True)

# Dropping columns by name inplace
df.drop(['Salary', 'Department'], axis=1, inplace=True)

Output kod di atas diberikan di bawah:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Di sini, anda boleh melihat bahawa kami tidak mencipta sebarang DataFrame baharu tetapi membuat perubahan kepada yang asal.

Cara Bekerja Dengan Indeks dalam Panda

Dalam bahagian ini, kita akan membincangkan cara bekerja dengan indeks dalam DataFrame panda . Kami akan merangkumi dua sub-bahagian berikut:

  1. Tetapkan dan tetapkan semula Indeks

  2. Lajur ID dan indeks

1. Cara Menetapkan dan Tetapkan Semula Indeks

Satu aspek penting dalam bekerja dengan panda ialah memahami cara menetapkan dan menetapkan semula lajur indeks. Indeks ialah pengecam utama untuk setiap baris dan terdapat keadaan apabila anda mungkin ingin menukarnya.

Menetapkan Indeks Baharu

Untuk menetapkan indeks baharu, anda boleh menggunakan kaedah set_index() . Sintaks set_index diberikan di bawah:

df.set_index('column_name', inplace=True)

Argumen inplace=True di sini bermakna kami membuat perubahan pada DataFrame sedia ada.

Untuk menunjukkan ini, kami akan menggunakan DataFrame berikut:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Katakan kami ingin menjadikan lajur Nama sebagai indeks bagi DataFrame kami. Untuk mencapai ini, kita boleh menggunakan kod berikut:

df.set_index('Name', inplace=True)

Skrip Python ini akan menjadikan Name sebagai indeks DataFrame kami. Output kod ini diberikan di bawah:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Menetapkan semula nilai Indeks

Untuk menetapkan semula indeks kepada format lalainya (iaitu, RangeIndex daripada 0 hingga panjang DataFrame tolak 1), anda boleh menggunakan kaedah reset_index() .

Sintaks reset_index() diberikan di bawah:

df.reset_index(drop=True, inplace=True)

Dengan menetapkan drop=True , lajur indeks semasa akan dialih keluar, manakala inplace=True memastikan perubahan digunakan terus pada DataFrame tanpa membuat yang baharu.

Apabila kami menggunakan kod ini pada DataFrame sebelumnya, kami mendapat output berikut:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Anda boleh melihat bahawa Nama, yang sebelum ini merupakan indeks kami, ditetapkan semula kepada nilai lalai.

2. Operasi Selanjutnya Dengan Lajur Indeks

Apabila anda mengimport DataFrame daripada, katakan, fail CSV, anda boleh menggunakan parameter index_col untuk menentukan lajur untuk digunakan sebagai indeks anda.

Sintaks index_col diberikan di bawah:

df = pd.read_csv('data.csv', index_col='column_name')

Tambahan pula, jika anda ingin mengeksport DataFrame tanpa lajur indeks, anda boleh menetapkan parameter indeks kepada Palsu.

Sintaks untuk kaedah ini diberikan di bawah:

df.to_csv('output.csv', index=False)

Sekarang setelah anda memahami kaedah untuk menjatuhkan indeks, mari lihat cara anda boleh mengendalikan ralat apabila menggunakan fungsi drop dalam bahagian seterusnya.

Cara Mengendalikan Ralat Semasa Menggunakan Fungsi Drop dalam Panda

Dalam bahagian ini, kami akan meneroka cara mengendalikan ralat dan kes khas apabila menggunakan fungsi drop panda untuk mengalih keluar lajur indeks daripada DataFrame.

Secara khusus, kami akan membincangkan perkara berikut:

  1. Mengendalikan KeyError

  2. Bekerja dengan baris pendua

1. Cara Mengendalikan KeyError

Apabila menggunakan fungsi drop dalam panda, anda mungkin menghadapi KeyError jika indeks atau lajur yang ditentukan tidak ditemui dalam DataFrame.

Untuk mengelakkan ralat ini daripada berlaku, anda boleh menggunakan parameter ralat . Parameter ralat mempunyai dua pilihan: 'naikkan' dan 'abaikan'. Secara lalai, ia ditetapkan kepada 'naikkan', yang bermaksud bahawa KeyError akan dinaikkan jika indeks atau lajur yang ditentukan tidak ditemui.

Walau bagaimanapun, anda boleh menetapkannya kepada 'abaikan' jika anda ingin menyekat ralat dan terus melaksanakan kod tersebut.

Katakan kita mempunyai DataFrameLet's cuba lepaskan baris yang tidak wujud dalam DataFrame dan lihat apa yang berlaku:

# Attempt to drop a non-existent index, will raise KeyError
# df.drop(5, inplace=True)

Skrip Python akan memberikan ralat berikut:

Untuk mengendalikan ralat sedemikian, pastikan anda merujuk kepada baris yang terdapat dalam set data.

2. Cara Bekerja Dengan Baris Pendua

Apabila membersihkan data, tugas penting ialah mencari pendua dan mengalih keluarnya.

Berurusan dengan baris pendua dalam DataFrame boleh menambah kerumitan apabila menggunakan fungsi drop .

Jika anda ingin menggugurkan baris berdasarkan nilai indeks pendua, anda boleh menggunakan fungsi pendua , dan kemudian gunakan pengindeksan boolean untuk memilih hanya baris tidak pendua.

Katakan kita mempunyai DataFrame berikut:

Lajur Indeks Penurunan Pandas: Diterangkan Dengan Contoh

Anda boleh melihat bahawa kami mempunyai indeks pendua dalam set data kami. Untuk mengalih keluar pendua, pertama, kami akan mengenal pasti nilai pendua dengan kod berikut:

# Find duplicated index values
duplicated_rows = df.index.duplicated(keep='first')

Selepas ini, kami hanya akan memilih baris yang tidak diduplikasi dan menyimpannya dalam DataFrame sebelumnya dengan kod berikut:

# Select only non-duplicated rows
df = df[~duplicated_rows]

Output akhir diberikan di bawah:

Output akhir tidak lagi mempunyai baris pendua.

Fikiran Akhir

Semasa anda meneruskan perjalanan sains data dan analitis anda, memahami cara memanipulasi dan mengurus data ialah kemahiran yang akan membuktikan yang paling penting.

Menguasai operasi seperti menjatuhkan indeks dalam panda adalah bahagian penting dalam hal ini. Mengetahui cara menetapkan semula atau menjatuhkan indeks ialah batu loncatan ke arah membersihkan, mengubah dan memperoleh cerapan berharga daripada data anda.

Dengan mempelajari cara menjatuhkan indeks, anda akan dapat membentuk semula DataFrames anda dengan lebih berkesan. Anda juga akan dapat mencipta set data yang lebih bersih yang lebih mudah dibaca dan dianalisis. Selain itu, menetapkan semula indeks boleh menjadi penting apabila menggabungkan atau menggabungkan berbilang DataFrames, di mana konflik indeks boleh timbul.

Keupayaan untuk menurunkan indeks membolehkan anda mempunyai kawalan dan fleksibiliti yang lebih besar ke atas set data anda!


Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.

Pelaporan Perniagaan Menggunakan LuckyTemplates

Pelaporan Perniagaan Menggunakan LuckyTemplates

Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu