MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

MultiIndex dalam Panda ialah objek berbilang peringkat atau hierarki yang membolehkan anda memilih lebih daripada satu baris dan lajur dalam indeks anda. Ia juga membolehkan anda membuat analisis dan manipulasi data yang canggih, terutamanya untuk bekerja dengan data dimensi yang lebih tinggi. Dalam tutorial ini, saya akan meneroka ciri MultiIndex Pandas. Anda boleh menonton video penuh tutorial ini di bahagian bawah blog ini.

Idea di sini ialah kita mempunyai indeks yang juga mengandungi hierarki. Jika anda pernah menggunakan Pandas sebelum ini, anda tahu bahawa bingkai data Pandas mengandungi indeks , jadi kami akan menambah lapisan tambahan padanya. Itu akan menjadikan pengindeksan dan pembentukan semula data lebih mudah, bergantung pada jika anda memang mempunyai hierarki untuk data anda.

Sebagai contoh, kami akan menggunakan set data Gapminder yang terkenal, dan ini sememangnya MultiIndex di sini. Kami mempunyai hierarki, jadi gerudi benua ke negara-negara, dan setiap negara boleh menggerudi dalam beberapa tahun. Jadi, kita boleh memanipulasi indeks ini dan perkara akan menjadi lebih mudah untuk dikodkan apabila kita menggunakan MultiIndex ini. Kami akan melihat menghiris dan juga membentuk semula set data Gapminder.

Isi kandungan

Cara Menggunakan MultiIndex Dalam Panda

Kami akan menggunakan set data Gapminder. Jika anda tidak memasang ini, anda ingin melakukan pemasangan PIP Gapminder. Saya akan membawa masuk Panda juga. Saya menggunakan pengedaran Anaconda Python. Dalam kes itu, Panda itu akan dipasang sudah. Kami melakukan import Gapminder, dan kemudian kami akan melihat data ini.

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

Seperti yang anda lihat di sini, sekali lagi kami mempunyai indeks atau hierarki. Saya harus mengatakan bahawa kita mempunyai benua, negara, dan kemudian setahun. Pada masa ini, indeks hanyalah angka seperti ini, dan kami akan menetapkan indeks kami sendiri sekarang. Dan cara kami akan melakukannya adalah dengan Gapminder. Kami akan menetapkan indeks. Kami akan menetapkannya di benua, negara, dan kemudian tahun, inplace sama dengan ( = ) true .

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

Ini hanya menyimpan hasil, jadi kita tidak perlu memanggil pembolehubah dua kali, hanya lebih cekap sedikit. Dan sekarang, anda akan melihat bahawa kami mempunyai indeks di sini, (kandungan, negara, tahun) dan ini ialah berbilang indeks kami.

Beberapa perkara yang boleh kami lakukan di sini. Katakan, sebagai contoh, saya mahukan segala-galanya di benua Eropah. Saya mahu menapis atau menghiris bingkai data ini. Saya boleh menggunakan gapminder.loc , dan kemudian taip di Eropah. Anda mungkin biasa dengan loc. Daripada keadaan lain dalam Panda, ia berfungsi dengan lebih mudah apabila kita melakukannya mengikut indeks.

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

Sekarang ini wujud dalam hierarki. Katakan, kami hanya mahukan data daripada United Kingdom. Nampaknya kita hanya boleh memotong ini, tetapi ini akan menjadi masalah kerana apabila kita mengindeks ini, kita terjebak untuk menggunakan hierarki. Kita perlu bermula dengan peringkat pertama, dan kemudian gerudi ke peringkat kedua, dan yang ketiga, dan sebagainya.

Jika saya mahu memasukkan berbilang peringkat, apa yang boleh saya lakukan ialah luluskannya di sini. Saya akan pergi ke Eropah, dan kemudian United Kingdom. Saya juga boleh pergi selangkah lebih jauh dan meletakkan 1997. Dan sekarang, kita boleh lihat di sini keputusan baris itu dalam kes itu.

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

Satu lagi perkara yang menarik dengan MultiIndex dalam Pandas ialah lebih mudah untuk membentuk semula data. Saya boleh melakukan gapminder_pivot dan kemudian gapminder.unstack . Jika saya perlu membentuk semula set data ini, atas sebab tertentu, saya akan mencetak ini dan anda akan melihat bahawa kini kita mempunyai benua, negara, dan kemudian tahun bersama-sama dengan lajur.

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

Sekarang, katakan saya mahu melakukannya dalam arah yang bertentangan. Apa yang saya perlu lakukan ialah nyahpaut dan kita akan lakukan gapminder_pivot . Jika itu menyahtindan, maka ini ialah menyusun gapminder_unpivot.

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki

Sekarang, bagaimana jika saya ingin menyingkirkan indeks ini dan menetapkannya semula dan menukarnya kepada yang lain? Apa yang perlu saya lakukan dalam kes itu ialah gapminder_unpivot. Kami akan reset_index . Kami akan membuat inplace itu semula. Kita tidak perlu menyimpan sendiri. Ia lebih cekap sedikit. Kemudian, gapminder_unpivot.

Cetak itu dan kami kembali kepada data asal kami dan kami mempunyai indeks. Permulaan angka adalah pada sifar kerana Python adalah pengindeksan berasaskan sifar.

MultiIndex Dalam Panda Untuk Data Berbilang Tahap Atau Hierarki


Python Dalam LuckyTemplates: Cara Memasang Dan Menyediakan
Skrip Python Dalam Laporan Data LuckyTemplates
LuckyTemplates Dengan Skrip Python Untuk Mencipta Jadual Tarikh

Kesimpulan

Panda pada mulanya dinamakan sempena data panel. Ia benar-benar bertujuan untuk berfungsi dengan data panel, yang merupakan jenis data siri masa tertentu dengan berbilang kategori. Dalam kes itu, mempunyai hierarki benar-benar masuk akal, bukan?

Ini berfungsi dengan baik jika anda bekerja dengan baris unik, cuba mencari berbilang lajur.

Setakat prestasi, mungkin indeks tidak diperlukan jika anda bergabung, tetapi kami tidak bergabung di sini. Kami baru sahaja beroperasi, mengakses, mengindeks, membentuk semula, dsb. Walau bagaimanapun, kecekapan pengekodan pastinya merupakan faedah yang besar.

Jadi itu sahaja untuk MultiIndex dalam Panda. Saya harap ini adalah sesuatu yang boleh anda gunakan. Anda belajar sesuatu yang baharu tentang Panda hari ini.

Semua yang terbaik!


Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.

Pelaporan Perniagaan Menggunakan LuckyTemplates

Pelaporan Perniagaan Menggunakan LuckyTemplates

Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu