Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
MultiIndex dalam Panda ialah objek berbilang peringkat atau hierarki yang membolehkan anda memilih lebih daripada satu baris dan lajur dalam indeks anda. Ia juga membolehkan anda membuat analisis dan manipulasi data yang canggih, terutamanya untuk bekerja dengan data dimensi yang lebih tinggi. Dalam tutorial ini, saya akan meneroka ciri MultiIndex Pandas. Anda boleh menonton video penuh tutorial ini di bahagian bawah blog ini.
Idea di sini ialah kita mempunyai indeks yang juga mengandungi hierarki. Jika anda pernah menggunakan Pandas sebelum ini, anda tahu bahawa bingkai data Pandas mengandungi indeks , jadi kami akan menambah lapisan tambahan padanya. Itu akan menjadikan pengindeksan dan pembentukan semula data lebih mudah, bergantung pada jika anda memang mempunyai hierarki untuk data anda.
Sebagai contoh, kami akan menggunakan set data Gapminder yang terkenal, dan ini sememangnya MultiIndex di sini. Kami mempunyai hierarki, jadi gerudi benua ke negara-negara, dan setiap negara boleh menggerudi dalam beberapa tahun. Jadi, kita boleh memanipulasi indeks ini dan perkara akan menjadi lebih mudah untuk dikodkan apabila kita menggunakan MultiIndex ini. Kami akan melihat menghiris dan juga membentuk semula set data Gapminder.
Isi kandungan
Cara Menggunakan MultiIndex Dalam Panda
Kami akan menggunakan set data Gapminder. Jika anda tidak memasang ini, anda ingin melakukan pemasangan PIP Gapminder. Saya akan membawa masuk Panda juga. Saya menggunakan pengedaran Anaconda Python. Dalam kes itu, Panda itu akan dipasang sudah. Kami melakukan import Gapminder, dan kemudian kami akan melihat data ini.
Seperti yang anda lihat di sini, sekali lagi kami mempunyai indeks atau hierarki. Saya harus mengatakan bahawa kita mempunyai benua, negara, dan kemudian setahun. Pada masa ini, indeks hanyalah angka seperti ini, dan kami akan menetapkan indeks kami sendiri sekarang. Dan cara kami akan melakukannya adalah dengan Gapminder. Kami akan menetapkan indeks. Kami akan menetapkannya di benua, negara, dan kemudian tahun, inplace sama dengan ( = ) true .
Ini hanya menyimpan hasil, jadi kita tidak perlu memanggil pembolehubah dua kali, hanya lebih cekap sedikit. Dan sekarang, anda akan melihat bahawa kami mempunyai indeks di sini, (kandungan, negara, tahun) dan ini ialah berbilang indeks kami.
Beberapa perkara yang boleh kami lakukan di sini. Katakan, sebagai contoh, saya mahukan segala-galanya di benua Eropah. Saya mahu menapis atau menghiris bingkai data ini. Saya boleh menggunakan gapminder.loc , dan kemudian taip di Eropah. Anda mungkin biasa dengan loc. Daripada keadaan lain dalam Panda, ia berfungsi dengan lebih mudah apabila kita melakukannya mengikut indeks.
Sekarang ini wujud dalam hierarki. Katakan, kami hanya mahukan data daripada United Kingdom. Nampaknya kita hanya boleh memotong ini, tetapi ini akan menjadi masalah kerana apabila kita mengindeks ini, kita terjebak untuk menggunakan hierarki. Kita perlu bermula dengan peringkat pertama, dan kemudian gerudi ke peringkat kedua, dan yang ketiga, dan sebagainya.
Jika saya mahu memasukkan berbilang peringkat, apa yang boleh saya lakukan ialah luluskannya di sini. Saya akan pergi ke Eropah, dan kemudian United Kingdom. Saya juga boleh pergi selangkah lebih jauh dan meletakkan 1997. Dan sekarang, kita boleh lihat di sini keputusan baris itu dalam kes itu.
Satu lagi perkara yang menarik dengan MultiIndex dalam Pandas ialah lebih mudah untuk membentuk semula data. Saya boleh melakukan gapminder_pivot dan kemudian gapminder.unstack . Jika saya perlu membentuk semula set data ini, atas sebab tertentu, saya akan mencetak ini dan anda akan melihat bahawa kini kita mempunyai benua, negara, dan kemudian tahun bersama-sama dengan lajur.
Sekarang, katakan saya mahu melakukannya dalam arah yang bertentangan. Apa yang saya perlu lakukan ialah nyahpaut dan kita akan lakukan gapminder_pivot . Jika itu menyahtindan, maka ini ialah menyusun gapminder_unpivot.
Sekarang, bagaimana jika saya ingin menyingkirkan indeks ini dan menetapkannya semula dan menukarnya kepada yang lain? Apa yang perlu saya lakukan dalam kes itu ialah gapminder_unpivot. Kami akan reset_index . Kami akan membuat inplace itu semula. Kita tidak perlu menyimpan sendiri. Ia lebih cekap sedikit. Kemudian, gapminder_unpivot.
Cetak itu dan kami kembali kepada data asal kami dan kami mempunyai indeks. Permulaan angka adalah pada sifar kerana Python adalah pengindeksan berasaskan sifar.
Python Dalam LuckyTemplates: Cara Memasang Dan Menyediakan
Skrip Python Dalam Laporan Data LuckyTemplates
LuckyTemplates Dengan Skrip Python Untuk Mencipta Jadual Tarikh
Kesimpulan
Panda pada mulanya dinamakan sempena data panel. Ia benar-benar bertujuan untuk berfungsi dengan data panel, yang merupakan jenis data siri masa tertentu dengan berbilang kategori. Dalam kes itu, mempunyai hierarki benar-benar masuk akal, bukan?
Ini berfungsi dengan baik jika anda bekerja dengan baris unik, cuba mencari berbilang lajur.
Setakat prestasi, mungkin indeks tidak diperlukan jika anda bergabung, tetapi kami tidak bergabung di sini. Kami baru sahaja beroperasi, mengakses, mengindeks, membentuk semula, dsb. Walau bagaimanapun, kecekapan pengekodan pastinya merupakan faedah yang besar.
Jadi itu sahaja untuk MultiIndex dalam Panda. Saya harap ini adalah sesuatu yang boleh anda gunakan. Anda belajar sesuatu yang baharu tentang Panda hari ini.
Semua yang terbaik!
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.
Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.
Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.
Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.
Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.
Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.
Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.
Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.
Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu