Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Apabila bekerja dengan set data yang terdiri daripada berbilang pembolehubah, sebaiknya dapat memahami cara ini berbeza dan berinteraksi antara satu sama lain. Dalam tutorial ini, saya akan menunjukkan bagaimana anda boleh menggunakan fungsi Seaborn dalam Python untuk menggambarkan alternatif kepada pengedaran pembolehubah. Anda boleh menonton video penuh tutorial ini di bahagian bawah blog ini.
Isi kandungan
Menggunakan Fungsi Seaborn Dalam Python
Saya akan menunjukkan ini pada set data MPG, yang tersedia dalam Seaborn. Jadi, mari kita teruskan dan import mana-mana pakej yang kita perlukan serta mana-mana data yang kita perlukan. Kami akan melihat pengedaran pembolehubah MPG di sini dan bagaimana ia berbeza. Dua cara biasa untuk melakukannya ialah histogram dan boxplot .
Jadi saya akan menggunakan fungsi displot (DIS untuk pengedaran). Kemudian, saya perlu menentukan set data apakah itu dan pembolehubah apa yang akan kita letakkan pada paksi X. Dan dengan itu, kami mempunyai pengedaran.
Ini cukup bagus. Ini sangat mudah untuk melihat keseluruhan pengedaran dan bentuknya. Beberapa kelemahan dengan visualisasi pengedaran ini walaupun. Satu ialah bilangan tong yang kami gunakan boleh dikatakan sewenang-wenangnya. Perkara lain ialah kita tidak semestinya tahu serta-merta apa maksud pembolehubah itu.
Perkara yang menarik dengan Seaborn ialah sebaik sahaja saya menyediakan pembolehubah yang saya mahu, di mana, dan set data yang saya gunakan, ia benar-benar plug-and-chug dengan membuat visualisasi baharu. Sekarang kita akan pergi ke boxplot. Boxplot tidak menggunakan tong sampah.
Idea di sini ialah kita dapat melihat nilai kuartil dengan jelas, median secara khusus, dan kita melihat nilai kuartil yang lain. Kami melihat ada yang terpencil, dan ini adalah plot yang sangat tepat. Petak kotak isunya ialah ia tepat dengan perkara yang biasanya tidak diambil berat oleh ramai pengguna perniagaan.
Jadi, plot ini agak sukar untuk orang bukan statistik untuk benar-benar mendapat banyak nilai. Dan sekali lagi, ia mengagregatkan data, jadi kami kehilangan banyak butiran. Sukar untuk mengetahui dengan tepat rupanya. Kita boleh lihat ada yang terpencil. Kita boleh lihat kebanyakan nilai ada di sini. Histogram memberi kita cara yang lebih intuitif untuk melihatnya.
Ini adalah kedua-dua plot yang bagus. Mereka berdua mempunyai tujuan masing-masing. Mari lihat beberapa alternatif menggunakan Seaborn untuk menggambarkan. Kami akan kekal dengan MPG untuk pengedaran pembolehubah itu.
Sama seperti boxplot, anda boleh lihat di sini bahawa median ditandakan dengan jelas. Kami melihat julat kuartil juga dan kami boleh melihat dengan lebih baik tentang taburan keseluruhan. Ini seperti histogram juga. Ia dipanggil plot anggaran ketumpatan kernel atau plot KDE. Ia adalah versi histogram yang lancar. Kami tidak menggunakan sebarang binning sewenang-wenangnya. Segala-galanya diselaraskan ke dalam julat berterusan di sini.
Ini adalah sejenis hibrid daripada kedua-dua pendekatan ini dan benar-benar menjaga beberapa kelemahan. Walau bagaimanapun, bergantung pada khalayak anda, mereka mungkin benar-benar sukar melihat perkara ini. Mereka mungkin tidak biasa dengannya, tetapi ia mempunyai beberapa faedah kepada pendekatan tradisional.
Dalam pendekatan ini, kami tidak mengagregatkan data lagi. Setiap titik individu diplot. Ini mengambil elemen plot taburan, bukan? Jika anda berfikir tentang plot serakan, kami memplot setiap titik individu pada koordinat X dan Y.
Akhir sekali, kami mempunyai plotplot . Apa yang kami lakukan di sini ialah mengambil pengedaran itu dan kami menyebarkan secara rawak. Ini adalah proses rawak. Kami tidak cuba membuat bentuk pengedaran itu lagi. Isu dengan ini ialah kita mempunyai semua rumpun ini bertembung antara satu sama lain, jadi itu mungkin tidak bagus bergantung pada apa yang anda cuba lakukan. Mungkin anda ingin mewarna ini mengikut kumpulan atau sesuatu seperti itu, jadi ada pilihan untuk itu.
Kita boleh menukar jitter kepada .25 dan melihat bahawa apabila kita meningkatkan jitter, titik-titik ini tersebar lebih sedikit.
Walau bagaimanapun, setiap kali saya menjalankannya, ia akan kelihatan sedikit berbeza. Jadi, jika anda ingin menyingkirkannya dan menjadikannya sama setiap kali, anda boleh mengimport numpy sebagai np . Apa yang dilakukan ini ialah apa yang dipanggil menetapkan benih rawak.
Setiap kali saya menjalankan sesuatu yang berkaitan dengan nombor rawak, ia akan menggunakan nombor rawak yang sama. Perkara tidak berubah secara rawak apabila anda menyiarkannya semula. Ini mungkin bagus untuk sebarang jenis simulasi yang anda lakukan, yang banyak berlaku dalam sains data dan analitik dengan visualisasi ini juga. Jadi sekarang, setiap kali saya menjalankan plot ini, kita akan mendapat rupa yang sama.
Saya juga boleh menambah di sini asal Y, dan kini kita melihat bahawa kita sedang mencipta pengedaran dwi-varian. Kami mengambil pengedaran perbatuan dan membahagikannya mengikut asal.
Cara Menggunakan Skrip Python Dalam
Skrip Python LuckyTemplates Dalam Laporan Data LuckyTemplates
Set Data Dalam Panda Dengan ProfileReport() | Python Dalam LuckyTemplates
Kesimpulan
Ini adalah alternatif untuk menggambarkan taburan satu pembolehubah. Mereka semua mempunyai kebaikan dan keburukan mereka. Ini bukan bermaksud, jangan sekali-kali menggunakan plot kotak atau histogram, tetapi ia hanya mengatakan, berikut adalah beberapa pilihan lain, bergantung pada perkara yang anda cuba tunjukkan.
Kesemuanya semudah dibuat seperti mana-mana yang lain apabila kami menggunakan fungsi Seaborn dalam Python. Jika anda ingin mengetahui lebih lanjut tentang Python , lihat pautan di bawah.
Semua yang terbaik!
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.
Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.
Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.
Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.
Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.
Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.
Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.
Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.
Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu