Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Dalam blog hari ini, kami akan melalui proses memvisualisasikan korelasi Python dan cara mengimport visual ini ke dalam LuckyTemplates. Anda boleh menonton video penuh tutorial ini di bahagian bawah blog ini.
Isi kandungan
Memahami Korelasi
Berikut ialah imej bagus yang menunjukkan pelbagai jenis korelasi.
Bermula dari kiri, kita mempunyai korelasi positif yang sempurna yang bermaksud ia mempunyai nilai korelasi 1. Kemudian, ia diikuti dengan korelasi positif dalam tertib menurun yang membawa kepada 0.
Graf tengah tidak menunjukkan korelasi yang menunjukkan nilai korelasi sama dengan 0.
Akhir sekali, sebelah kanan menunjukkan nilai korelasi negatif yang semakin berkurangan daripada 0. Graf paling kanan ialah korelasi negatif sempurna yang mempunyai nilai korelasi -1.
Pakej untuk Korelasi Python
Kami akan menggunakan empat pakej untuk tutorial ini. Pakej pertama kami ialah Panda untuk digunakan untuk manipulasi data dan disimpan sebagai pd pembolehubah .
Untuk visualisasi, kami akan menggunakan Matplotlib , disimpan sebagai pembolehubah plt untuk penggunaan fungsi ini dengan lebih mudah. Seaborn , perpustakaan visualisasi statistik kami, akan disimpan sebagai sns . Dan akhir sekali, Numpy , untuk disimpan sebagai np , akan digunakan untuk algebra linear.
Untuk data, kami akan menggunakan set data sampel dalam Seaborn. Kemudian menggunakan pembolehubah sns, kami akan membawa masuk dataset berlian seperti yang ditunjukkan di bawah. .
Atribut Data
Kami boleh melihat atribut data kami menggunakan fungsi dataset.info . Fungsi ini menunjukkan kepada kita semua jenis data yang berbeza seperti yang dilihat dalam lajur terakhir di bawah.
Ambil perhatian bahawa korelasi hanya berfungsi pada pembolehubah berangka, oleh itu, kita akan melihat pembolehubah berangka pada kebanyakan masa. Walau bagaimanapun, kami juga akan mempelajari cara menggunakan beberapa pembolehubah kategori untuk visualisasi.
Set Data Korelasi Python
Dengan menggunakan kepala fungsi yang ditulis sebagai dataset.head , kita boleh mendapatkan lima baris teratas data kita yang sepatutnya kelihatan seperti ini.
Kami mempunyai karat dalam lajur pertama, diikuti dengan pembolehubah kategori cut , color , dan clarity , dan kemudian nilai berangka untuk data yang lain.
Korelasi Python: Mencipta Plot Scatter
Apabila menggambarkan korelasi dan melihat dua pembolehubah, kita biasanya melihat plot serakan .
Oleh itu, menggunakan perpustakaan Seaborn, kami telah mencipta plot serakan kami menggunakan fungsi plot serakan di mana kami menghantar data yang kami simpan di atas sebagai data=set data . Kemudian, kami mengenal pasti pembolehubah X dan Y— karat dan harga , masing-masing.
Inilah plot taburan kami yang dibuat dengan perpustakaan Seaborn.
Anda boleh lihat plot taburan ini agak padat. Ini kerana kami mempunyai kira-kira 54,000 baris data dan mata tidak semestinya diwakili dengan cara yang terbaik.
Kita boleh menekan kekunci Shift + Tab untuk melihat cara berbeza untuk menggayakan plot taburan. Ia akan menunjukkan kepada kami senarai parameter berbeza yang boleh kami tambahkan pada plot taburan kami.
Menatal lebih jauh ke bawah akan memberi kami maklumat tentang perkara yang dilakukan oleh setiap parameter yang disenaraikan.
Parameter Plot Taburan Tambahan
Mari kita menyelam sedikit. Kita boleh membuat linewidth=0 kerana garis putih dalam plot serakan pertama kita, ditunjukkan di bawah, perkara yang agak kabur.
Kami juga mahu melaraskan alfa supaya kami boleh mengawal kelegapan. Mari kita gunakan alpha=0.2 untuk contoh kita. Tetapi sudah tentu, anda boleh menukarnya kepada 0.1 juga.
Jika kami menambah parameter ini dan klik pada Run , anda boleh melihat plot taburan kami menjadi lebih legap tanpa garis putih.
Anda boleh bermain-main dengan parameter untuk mendapatkan visual terbaik yang anda cari.
Menggunakan Pembolehubah Kategori
Kami juga boleh menggunakan beberapa pembolehubah kategori kami untuk meningkatkan visual kami. Sebagai contoh, kami tahu bahawa data kami mempunyai potongan untuk berlian kami.
Apa yang boleh kita lakukan ialah lulus dalam kategori potong itu menggunakan parameter hue sebagai hue='cut'. Ini akan membolehkan kita menggambarkan mata ini dengan menukar warna.
Sudah tentu, kita boleh menambah lebih banyak parameter seperti alfa, sebagai contoh. Kita boleh menambahnya sekali lagi, ditetapkan kepada 0.2, dan melihat cara itu mengubah visual. Mari klik Jalankan dan anda boleh melihat sedikit perbezaan.
Kita boleh bermain-main dengan parameter untuk mendapatkan visual yang kita cari. Kita juga boleh menggunakan kategori yang berbeza seperti kejelasan, yang memberikan kita kategori kejelasan dan juga memberi kita pandangan yang sedikit berbeza tentang serakan itu.
Korelasi Dengan Pembolehubah Lain
Anda juga mungkin berminat tentang cara nilai lain dikaitkan selain daripada harga dan karat. Jadi, jika kita melihat plot serakan untuk jadual , yang merupakan dimensi berangka berlian dan kedalaman itu , kita dapat melihat tiada hubungan linear satu dengan satu.
Kita juga boleh melihat dua pembolehubah lain seperti kedalaman dan harga . Berdasarkan graf, kita dapat melihat bahawa pusat data di sekitar kawasan tengah.
Korelasi Python: Mencipta Plot Regresi
Mari kita maju ke apa yang kita panggil plot regresi yang membolehkan kita menilai hubungan linear antara dua pembolehubah.
Jadi daripada fungsi plot taburan, kita akan menggunakan fungsi regplot kali ini. Kami akan lulus dalam struktur yang sama-data kami kemudian pembolehubah X dan Y.
Hasilnya menunjukkan garis yang mengukur hubungan linear antara pembolehubah. Ia juga jelas bagaimana nilai kita mengelilingi garis regresi itu.
Ini bukanlah visual yang sangat cantik pada masa ini, tetapi kami masih boleh mengoptimumkannya untuk mendapatkan yang lebih baik. Sebagai contoh, kita boleh lulus dalam gaya menggunakan pembolehubah Matplotlib. Kita boleh menukar gaya kepada latar belakang gelap menggunakan kod plt.style.use('dark_background').
Ambil plot regresi yang sama dan masukkan beberapa kata kunci untuk serakan dan baris kami. Mari gunakan warna merah dan lebar garis 1 untuk garis regresi kami. Ini ditulis sebagai line_kws={“color” : “red”, 'linewidth' : 1).
Untuk kata kunci serakan kami, mari kita tetapkan warna sebagai putih, warna tepi sebagai kelabu dan kelegapan sebagai 0.4 untuk ditulis sebagai scatter_kws={“color” : “white”, 'edgecolor' : 'grey', 'alpha' : 0.4 ).
Parameter ini memberi kita sedikit pandangan berbeza yang ditunjukkan di bawah.
Korelasi Python: Mencipta Matriks Korelasi
Setakat ini, perkara yang kami lihat ialah plot serakan dengan hanya dua pembolehubah, tetapi kami juga mungkin mahu melihat semua korelasi pembolehubah kami.
Ini dilakukan menggunakan set data kami dengan fungsi bingkai data yang dipanggil korelasi yang diwakili sebagai dataset.corr. Dan apa yang kita akan dapat ialah matriks yang menunjukkan kita korelasi pada setiap satu pembolehubah ini.
Nombor dalam jadual di atas mewakili korelasi Pearson , yang memfokuskan pada hubungan linear antara semua pembolehubah ini.
Tetapi jika kita tidak pasti sama ada pembolehubah kita berkorelasi linear sepenuhnya, kita boleh menggunakan jenis korelasi yang berbeza yang lebih memfokuskan pada impak daripada bahagian linear. Ia dipanggil korelasi Spearman .
Dan kita boleh melihat maklumat tentang semua perkara ini dengan menekan Shift + Tab. Jika anda tatal ke bawah, kami dapat melihat korelasi pangkat Spearman, pekali korelasi Pearson dan banyak cara berbeza untuk mengukur data kami.
Melihat kembali kepada matriks korelasi kami sebelum ini, kami tahu bahawa harga dan karat berkorelasi dengan baik.
Ia adalah dari plot kami di sini menunjukkan bahawa ia agak linear pada 0.92.
Sekarang jika kita menggunakan korelasi Spearman sebaliknya, impak atau pangkat akan menjadi lebih tinggi sedikit pada 0.96.
Jenis korelasi yang berbeza ini membolehkan kita mengambil sifat korelasi yang berbeza antara pembolehubah tersebut.
Korelasi Pembolehubah Berbilang x Tunggal
Kadang-kadang, kita tidak mahu melihat matriks kerana kita lebih mengambil berat tentang korelasi semua pembolehubah dengan satu pembolehubah sahaja (cth, harga).
Apa yang boleh kita lakukan ialah mengasingkan harga menggunakan dataset.corr diikuti dengan 'price' .
Sekarang, kita dapat melihat bahawa harga dikaitkan dengan semua pembolehubah berangka kami yang berbeza dalam jadual ini. Dan sebab kita mungkin mahu melakukan ini adalah untuk plot visual.
Jadi mari kita lihat pada menggambarkan matriks korelasi kita dengan peta haba.
Korelasi Python: Mencipta Peta Haba
Kita boleh menghantar pembolehubah korelasi ini ke dalam peta haba Seaborn menggunakan fungsi sns.peta haba.
Ini akan memberi kita peta haba yang kelihatan seperti ini.
Sekali lagi, kita boleh menambah parameter pada keutamaan kita. Kita boleh memasukkan parameter linewidths=1 dan menambah anotasi menggunakan annot=True .
Dan anda dapat melihat bahawa peta haba kami kini kelihatan agak berbeza. Sekarang kami mempunyai peta haba yang cukup bagus.
Kita dapat melihat kegunaan menambah baris dan anotasi. Sekali lagi, jika kita menekan Shift + Tab, semua parameter berbeza yang boleh masuk ke dalamnya akan dipaparkan.
Seterusnya, cuba tambah method='spearman ' dalam kod kami, supaya anda tahu cara menggunakan jenis korelasi yang berbeza bergantung pada kes penggunaan anda.
Peta Haba Dengan Satu Pembolehubah
Seterusnya, kami mengasingkan satu pembolehubah dan mencipta peta haba dengan korelasi daripada negatif kepada positif.
Ini akan memberikan kami peta haba ini di bawah.
Kami pasti boleh mengubah gaya juga. Sebagai contoh, kita boleh menggunakan parameter cmap sebagai cmap='coolwarm' . Ini menukar warna kepada sejuk dan hangat, dan akan menghapuskan latar belakang hitam kami juga.
Jika kita klik Run , kita akan mendapat peta haba ini di bawah. Untuk sejuk, kami mempunyai biru dan kemudian untuk hangat, kami mempunyai bar merah.
Kami juga boleh menukar arah untuk menjajarkan peta kami dengan bar warna. Ini dilakukan dengan mengedit parameter sort_values kami dan menambah ascending=False .
Ini akan pergi daripada yang paling berkorelasi (bar merah) kepada yang paling kurang berkorelasi (bar biru).
Korelasi Python: Mencipta Visual Tangga
Satu cara lanjutan untuk menggambarkan korelasi kami adalah dengan menggunakan topeng untuk menyekat semua korelasi yang telah kami lakukan.
Kita boleh melakukan ini dengan Numpy, menggunakan beberapa fungsi TRUE dan FALSE untuk membuat visual tangga untuk korelasi kita.
Begini rupa hasilnya.
Mari lihat bagaimana kita boleh menyalurkannya ke LuckyTemplates.
Visual Tangga dalam LuckyTemplates
Pertama, buka LuckyTemplates. Saya telah membawa set data alpukat supaya kita dapat melihat visual yang berbeza. Anda boleh melihat set data ini di bawah anak tetingkap Fields. Mulakan visual Python dengan mengklik pada ikon Python di bawah anak tetingkap Visualisasi.
Kita perlu mencipta set data dengan menambah semua pembolehubah berangka yang ditunjukkan dengan ? . Tambahkannya dengan mengklik kotak semak di sebelah pembolehubah ini.
Sekarang setelah kami mempunyai set data, kami boleh pergi ke buku nota Jupyter kami dan menyalin kod ini yang kami ada sebelum ini.
Kemudian, kami akan menyalin kod ke editor skrip Python dalam LuckyTemplates.
Seterusnya, kami akan memilih visual kami, yang akan menjadi visual tangga. Kami akan kembali ke Jupyter, salin kod yang kami gunakan untuk visual tangga kami.
Tampalkan kod ke dalam editor skrip Python.
Perkara terakhir yang perlu dilakukan ialah pastikan kami menggunakan plt.show , yang diperlukan dalam skrip Python anda. Tambahkan plt.show pada baris terakhir kod dan klik ikon jalankan di penjuru kanan sebelah atas editor skrip.
Untuk visual yang lebih besar, rentangkan sedikit kotak supaya kita dapat melihat skrip berjalan di sudut. Kami mempunyai visual kami untuk peta haba kami, yang kelihatan agak bagus.
Dan dalam LuckyTemplates, kita pasti dapat melihat bagaimana visual itu mungkin berubah mengikut set data. Sebagai contoh, kita boleh mengklik ikon Slicer dalam anak tetingkap Visualisasi dan pergi ke Taip dalam anak tetingkap Medan.
Ia akan memberi kami dua jenis dalam set data kami, konvensional dan organik . Jika kita mengklik satu jenis, katakan organik , anda boleh melihat bahawa peta haba berubah.
Perubahan juga akan dikenakan apabila kita mengklik pada jenis konvensional seterusnya.
Ingat bahawa kita perlu mempunyai pembolehubah kategori dalam set data skrip Python kami untuk membuat penapis ini berfungsi. Seperti yang kita lihat, set data yang kami buat termasuk jenis , membolehkan kami menapis visual dengan cara itu.
Membina Perhubungan Model Data Anda Dalam
Analisis Teks LuckyTemplates Dalam Python | Skrip Python Pengenalan
Dalam Laporan Data LuckyTemplates
Kesimpulan
Dalam blog ini, anda mempelajari cara untuk menggambarkan korelasi dalam Python dan LuckyTemplates menggunakan kaedah yang berbeza seperti korelasi Pearson dan korelasi pangkat Spearman.
Kini, anda boleh membuat plot serakan, plot regresi, matriks korelasi, peta haba dan visual tangga untuk mendapatkan visual terbaik untuk set data anda. Anda juga boleh menggunakan pelbagai parameter untuk menambah baik gaya dan visual.
Semua yang terbaik,
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.
Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.
Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.
Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.
Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.
Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.
Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.
Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.
Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu