Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Blog ini akan menunjukkan cara menggunakan plot pengedaran terkumpul , juga dikenali sebagai Fungsi Pengedaran Kumulatif Empirikal atau plot ECDF, dan mempamerkan kelebihan menggunakan variasi plot ini berbanding jenis plot lain. Anda boleh menonton video penuh tutorial ini di bahagian bawah blog ini .
Kebanyakan orang lebih suka plot ECDF berbanding untuk menggambarkan data semasa mereka memplot setiap titik data secara langsung, dan ciri ini memudahkan pengguna berinteraksi dengan plot. Hari ini, anda akan belajar cara menggunakan ECDF dalam Python dan LuckyTemplates serta menambah baik pembentangan dan laporan anda tentang pengedaran data.
Isi kandungan
Jenis Petak Agihan
Saya akan mulakan dengan menapis data saya pada hari tertentu, Sabtu, dan kita boleh melihat di bawah semua plot Python ini digunakan untuk menerangkan pengedaran. Kami ada di sini plot ECDF, histogram, plot KDE dan plot Box.
Semua plot ini akan menerangkan cara data disebarkan atau diedarkan. Sebagai contoh, jika kita turun dan melihat histogram, kita dapat melihat bahawa kebanyakan tong tinggi ini akan berada di mana data kita terletak.
Pada sekitar $3.50, kami mempunyai tong tertinggi untuk data Petua kami dalam set data kami di bawah.
Kami juga boleh menggunakan plot KDE yang memberi kami metrik yang berbeza apabila melihat pengedaran. Histogram memperkatakan kiraan yang akan berada dalam tong sampah ini, manakala KDE memperkatakan ketumpatan.
Dengan plot KDE, anda boleh mengetahui di mana kebanyakan data kami berada dengan mengesan kepadatan terbesar atau bonjolan tertinggi dalam plot jika anda mahu. Jadi dalam imej di atas, kita boleh mengatakan bahawa ia diedarkan di antara $2 dan $4.
Perkara yang sama berlaku dalam plot Box, yang menunjukkan bahawa pengedaran adalah $2 hingga $4, dan di sinilah kebanyakan data kami akan berada. Ia menggunakan median, garis mendatar yang membahagikan kotak, untuk memberi kita idea di mana taburan terbesar.
Dan kemudian, kami mempunyai plot ECDF di mana di sebelah kiri paksi-y, anda boleh melihat perkataan Proportion , mewakili persentil kami. Berdasarkan plot, pada $3.50, kami melihat kira-kira 50% daripada data kami, dan pada $5 dan ke bawah ialah tempat 80% daripada data kami diedarkan.
Kod Plot Histogram
Sekarang saya akan menunjukkan kepada anda kod untuk setiap plot ini, bermula dengan histogram. Semuanya mempunyai pengekodan yang hampir serupa dan boleh diulang , jadi anda boleh menariknya dengan cepat menggunakan satu kod, seperti templat.
Mula-mula kita perlu mengimport Seaborn dan menyimpannya sebagai sb, diikuti dengan matplotlib.pyplot sebagai plt. Kami akan menggunakan gaya latar belakang yang dipanggil ggplot dan pembolehubah matplotlib itu untuk lulus dalam gaya yang berbeza.
Sebagai contoh, dalam imej di bawah, kita dapat melihat bahawa dalam baris ke-11, kami menambah tajuk untuk histogram dan saiz tanda dalam baris berikut. Yticks dan xticks mewakili saiz x dan y dengan sewajarnya .
Dalam baris ke-14, kami menggunakan pembolehubah Seaborn untuk menghantar dalam fungsi yang membawa dalam plot tertentu itu, seperti histplot dalam contoh di atas, yang mewakili plot histogram. Kami kemudian menghantar data dari baris ke-4 ke dalam fungsi sebagai set data.
Apa-apa sahaja yang anda masukkan ke dalam nilai mewakili set data anda dan akan menggugurkan pendua. Kemudian kami akan menggunakan x untuk petua , dan warna, yang , bersama-sama dengan seaborn, membolehkan anda memisahkan data anda mengikut kategori. Jika kita kembali kepada visual kita, kita boleh bahawa ia mempunyai kategori, termasuk, masa, atau perokok.
Plot KDE
Untuk plot KDE, semuanya hampir sama. Kita hanya perlu memasukkan parameter baharu yang dipanggil teduh untuk mempunyai rupa yang berlorek itu. Selain itu, warna, data dan selebihnya adalah sama.
Dengan plot Box, ia kebanyakannya serupa dengan plot lain kecuali beberapa perbezaan kecil. Di sini kita menggunakan fungsi boxplot di mana x ialah hari dan y ialah petua. Kami juga tidak menggunakan warna untuk plot ini.
Jadi ia adalah struktur yang sama seperti plot ECDF dan satu-satunya perbezaan adalah dalam pembolehubah Seaborn, di mana kita lulus dalam plot ECDF dan menggunakan warna sebagai hari. Tetapi kita juga boleh menukar warna itu kepada kategori lain yang kita ada, seperti perokok.
Jika kita melepasi kategori ini, kita akan mendapat plot ECDF yang mempunyai dua baris berbeza. Dalam pengedaran ini, kita dapat melihat bahawa perokok mempunyai lebih banyak mengenai lebar talian tertentu kita.
Bukan perokok mempunyai seratus peratus data itu di bawah $6, manakala perokok mempunyainya pada $6. Jadi menariknya, perokok kami mungkin meninggalkan tip yang lebih besar pada hari tertentu.
Menggayakan Plot ECDF
Kini kami boleh menggayakan lagi plot ECDF kami untuk menjadikannya lebih menarik. Dalam imej di bawah adalah plot ECDF yang berbeza. Dalam plot pertama, saya membuat garisan lebih besar dan menggunakan palet warna yang berbeza.
Dalam plot pertama, saya menggunakan parameter yang berbeza di dalam fungsi. Seperti yang anda lihat di bawah, saya lulus dalam palet sebagai musim panas dan lebar garisan sebagai 5.
Saya juga membandingkan Sabtu dan Ahad, itulah sebabnya terdapat dua garis hijau yang berbeza. Di sini kita dapat melihat bahawa petua $3 berada pada persentil ke-45 untuk hari Ahad dan persentil ke-70 untuk Khamis, yang memberitahu kita bahawa orang ramai cenderung untuk meninggalkan petua yang lebih tinggi pada hari Ahad.
Kami juga boleh menukar paksi X dan Y, menukar bahagian dan hujung di dalam plot kami, dan menukar palet, sama seperti dalam imej di bawah.
Di sini kita dapat melihat bahawa petua $2 berada pada persentil ke-20 untuk hari Ahad, iaitu garis ungu dalam plot. Jadi data adalah sama dengan plot ECDF sebelum ini dan hanya pembentangan yang berbeza.
Kami kini mempunyai plot lain dengan set data yang sama dan mengekalkan kedudukan paksi asal seperti yang ditunjukkan dalam imej di atas. Bezanya kali ini ialah arah garisan terbalik.
Gaya Plot ECDF
Jika kita melihat kod itu, semua yang kita lakukan ialah menghantar parameter pelengkap equals = true. Tindakan ini akan membolehkan kami mengatakan bahawa pada julat $2 dan ke atas ialah tempat 80% daripada data kami diedarkan, dan bukannya mengatakan di bawah julat $2 ialah tempat 20% daripada data kami diedarkan. Sekali lagi, ia adalah data yang sama dengan rupa atau cara penyampaian yang berbeza.
Dan dalam plot ECDF keempat dan terakhir kami, kami menggunakan Count dan bukannya perkadaran.
Pendekatan ini berguna apabila kita mempunyai lebih daripada beberapa plot. Dengan melihat lajur kiraan dalam imej di bawah, kita dapat melihat bahawa tidak banyak pemerhatian pada hari Jumaat, yang memberitahu kita bahawa orang ramai tidak meninggalkan banyak petua pada hari itu.
Keperluan Kod Plot ECDF
Jika kita melihat kod, anda akan menemui Seaborn , yang merupakan perkara utama untuk mencipta plot khusus ini. Kami juga mempunyai matplotlib.pyplot untuk penggayaan, yang boleh anda simpan sebagai pembolehubah yang dipanggil plt .
Kami kemudiannya boleh menggunakan pembolehubah itu untuk mencipta gaya yang berbeza untuk plot tertentu kami, seperti menambah tajuk dan saiz fon. Bahagian utama kod anda ialah fungsi plot ECDF anda yang kami bawa bersama Seaborn.
Plot Taburan Dalam Skrip R: Cara Mencipta & Mengimport
Fungsi Ditakrifkan Pengguna Python | Gambaran Keseluruhan
GGPLOT2 Dalam R: Visualisasi Dengan ESQUISSE
Kesimpulan
Itulah cara anda boleh menggunakan plot pengedaran yang berbeza, termasuk plot Histogram, KDE, Box dan ECDF. Anda juga mempelajari empat cara untuk membentangkan plot ECDF menggunakan set data yang sama. Anda boleh menggunakan sebarang pendekatan bergantung pada pilihan anda.
Sentiasa ingat untuk membawa masuk perpustakaan yang diperlukan untuk mencipta plot anda dan menggunakan fungsi yang betul. Selepas itu, ia hanya perlu mengubah aspek visual dan gaya plot anda seperti kedudukan paksi dan rona.
Semua yang terbaik,
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.
Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.
Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.
Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.
Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.
Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.
Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.
Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.
Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu