Korelasi Python: Panduan Mencipta Visual

Korelasi Python: Panduan Mencipta Visual

Dalam blog hari ini, kami akan melalui proses memvisualisasikan korelasi Python dan cara mengimport visual ini ke dalam LuckyTemplates. Anda boleh menonton video penuh tutorial ini di bahagian bawah blog ini.

Isi kandungan

Memahami Korelasi

Berikut ialah imej bagus yang menunjukkan pelbagai jenis korelasi. 

Korelasi Python: Panduan Mencipta Visual

Bermula dari kiri, kita mempunyai korelasi positif yang sempurna yang bermaksud ia mempunyai nilai korelasi 1. Kemudian, ia diikuti dengan korelasi positif dalam tertib menurun yang membawa kepada 0. 

Graf tengah tidak menunjukkan korelasi yang menunjukkan nilai korelasi sama dengan 0. 

Akhir sekali, sebelah kanan menunjukkan nilai korelasi negatif yang semakin berkurangan daripada 0. Graf paling kanan ialah korelasi negatif sempurna yang mempunyai nilai korelasi -1.

Pakej untuk Korelasi Python

Kami akan menggunakan empat pakej untuk tutorial ini. Pakej pertama kami ialah Panda untuk digunakan untuk manipulasi data dan disimpan sebagai pd pembolehubah . 

Untuk visualisasi, kami akan menggunakan Matplotlib , disimpan sebagai pembolehubah plt untuk penggunaan fungsi ini dengan lebih mudah. Seaborn , perpustakaan visualisasi statistik kami, akan disimpan sebagai sns . Dan akhir sekali, Numpy , untuk disimpan sebagai np , akan digunakan untuk algebra linear. 

Korelasi Python: Panduan Mencipta Visual

Untuk data, kami akan menggunakan set data sampel dalam Seaborn. Kemudian menggunakan pembolehubah sns, kami akan membawa masuk dataset berlian seperti yang ditunjukkan di bawah. .

Korelasi Python: Panduan Mencipta Visual

Atribut Data

Kami boleh melihat atribut data kami menggunakan fungsi dataset.info . Fungsi ini menunjukkan kepada kita semua jenis data yang berbeza seperti yang dilihat dalam lajur terakhir di bawah.

Korelasi Python: Panduan Mencipta Visual

Ambil perhatian bahawa korelasi hanya berfungsi pada pembolehubah berangka, oleh itu, kita akan melihat pembolehubah berangka pada kebanyakan masa. Walau bagaimanapun, kami juga akan mempelajari cara menggunakan beberapa pembolehubah kategori untuk visualisasi. 

Set Data Korelasi Python

Dengan menggunakan kepala fungsi yang ditulis sebagai dataset.head , kita boleh mendapatkan lima baris teratas data kita yang sepatutnya kelihatan seperti ini.

Korelasi Python: Panduan Mencipta Visual

Kami mempunyai karat dalam lajur pertama, diikuti dengan pembolehubah kategori cut , color , dan clarity , dan kemudian nilai berangka untuk data yang lain. 

Korelasi Python: Mencipta Plot Scatter

Apabila menggambarkan korelasi dan melihat dua pembolehubah, kita biasanya melihat plot serakan

Oleh itu, menggunakan perpustakaan Seaborn, kami telah mencipta plot serakan kami menggunakan fungsi plot serakan di mana kami menghantar data yang kami simpan di atas sebagai data=set data . Kemudian, kami mengenal pasti pembolehubah X dan Y— karat dan harga , masing-masing. 

Korelasi Python: Panduan Mencipta Visual

Inilah plot taburan kami yang dibuat dengan perpustakaan Seaborn. 

Korelasi Python: Panduan Mencipta Visual

Anda boleh lihat plot taburan ini agak padat. Ini kerana kami mempunyai kira-kira 54,000 baris data dan mata tidak semestinya diwakili dengan cara yang terbaik.

Kita boleh menekan kekunci Shift + Tab untuk melihat cara berbeza untuk menggayakan plot taburan. Ia akan menunjukkan kepada kami senarai parameter berbeza yang boleh kami tambahkan pada plot taburan kami. 

Korelasi Python: Panduan Mencipta Visual

Menatal lebih jauh ke bawah akan memberi kami maklumat tentang perkara yang dilakukan oleh setiap parameter yang disenaraikan. 

Korelasi Python: Panduan Mencipta Visual

Parameter Plot Taburan Tambahan

Mari kita menyelam sedikit. Kita boleh membuat linewidth=0 kerana garis putih dalam plot serakan pertama kita, ditunjukkan di bawah, perkara yang agak kabur. 

Korelasi Python: Panduan Mencipta Visual

Kami juga mahu melaraskan alfa supaya kami boleh mengawal kelegapan. Mari kita gunakan alpha=0.2 untuk contoh kita. Tetapi sudah tentu, anda boleh menukarnya kepada 0.1 juga. 

Korelasi Python: Panduan Mencipta Visual

Jika kami menambah parameter ini dan klik pada Run , anda boleh melihat plot taburan kami menjadi lebih legap tanpa garis putih. 

Korelasi Python: Panduan Mencipta Visual

Anda boleh bermain-main dengan parameter untuk mendapatkan visual terbaik yang anda cari. 

Menggunakan Pembolehubah Kategori

Kami juga boleh menggunakan beberapa pembolehubah kategori kami untuk meningkatkan visual kami. Sebagai contoh, kami tahu bahawa data kami mempunyai potongan untuk berlian kami. 

Apa yang boleh kita lakukan ialah lulus dalam kategori potong itu menggunakan parameter hue sebagai hue='cut'. Ini akan membolehkan kita menggambarkan mata ini dengan menukar warna. 

Korelasi Python: Panduan Mencipta Visual

Sudah tentu, kita boleh menambah lebih banyak parameter seperti alfa, sebagai contoh. Kita boleh menambahnya sekali lagi, ditetapkan kepada 0.2, dan melihat cara itu mengubah visual. Mari klik Jalankan dan anda boleh melihat sedikit perbezaan. 

Korelasi Python: Panduan Mencipta Visual

Kita boleh bermain-main dengan parameter untuk mendapatkan visual yang kita cari. Kita juga boleh menggunakan kategori yang berbeza seperti kejelasan, yang memberikan kita kategori kejelasan dan juga memberi kita pandangan yang sedikit berbeza tentang serakan itu.

Korelasi Python: Panduan Mencipta Visual

Korelasi Dengan Pembolehubah Lain

Anda juga mungkin berminat tentang cara nilai lain dikaitkan selain daripada harga dan karat. Jadi, jika kita melihat plot serakan untuk jadual , yang merupakan dimensi berangka berlian dan  kedalaman itu , kita dapat melihat tiada hubungan linear satu dengan satu.

Korelasi Python: Panduan Mencipta Visual

Kita juga boleh melihat dua pembolehubah lain seperti kedalaman dan harga . Berdasarkan graf, kita dapat melihat bahawa pusat data di sekitar kawasan tengah.

Korelasi Python: Panduan Mencipta Visual

Korelasi Python: Mencipta Plot Regresi

Mari kita maju ke apa yang kita panggil plot regresi yang membolehkan kita menilai hubungan linear antara dua pembolehubah. 

Jadi daripada fungsi plot taburan, kita akan menggunakan fungsi regplot kali ini. Kami akan lulus dalam struktur yang sama-data kami kemudian pembolehubah X dan Y. 

Korelasi Python: Panduan Mencipta Visual

Hasilnya menunjukkan garis yang mengukur hubungan linear antara pembolehubah. Ia juga jelas bagaimana nilai kita mengelilingi garis regresi itu.

Korelasi Python: Panduan Mencipta Visual

Ini bukanlah visual yang sangat cantik pada masa ini, tetapi kami masih boleh mengoptimumkannya untuk mendapatkan yang lebih baik. Sebagai contoh, kita boleh lulus dalam gaya menggunakan pembolehubah Matplotlib. Kita boleh menukar gaya kepada latar belakang gelap menggunakan kod plt.style.use('dark_background'). 

Korelasi Python: Panduan Mencipta Visual

Ambil plot regresi yang sama dan masukkan beberapa kata kunci untuk serakan dan baris kami. Mari gunakan warna merah dan lebar garis 1 untuk garis regresi kami. Ini ditulis sebagai line_kws={“color” : “red”, 'linewidth' : 1). 

Untuk kata kunci serakan kami, mari kita tetapkan warna sebagai putih, warna tepi sebagai kelabu dan kelegapan sebagai 0.4 untuk ditulis sebagai scatter_kws={“color” : “white”, 'edgecolor' : 'grey', 'alpha' : 0.4 ). 

Korelasi Python: Panduan Mencipta Visual

Parameter ini memberi kita sedikit pandangan berbeza yang ditunjukkan di bawah. 

Korelasi Python: Panduan Mencipta Visual

Korelasi Python: Mencipta Matriks Korelasi

Setakat ini, perkara yang kami lihat ialah plot serakan dengan hanya dua pembolehubah, tetapi kami juga mungkin mahu melihat semua korelasi pembolehubah kami.

Ini dilakukan menggunakan set data kami dengan fungsi bingkai data yang dipanggil korelasi yang diwakili sebagai dataset.corr. Dan apa yang kita akan dapat ialah matriks yang menunjukkan kita korelasi pada setiap satu pembolehubah ini. 

Korelasi Python: Panduan Mencipta Visual

Nombor dalam jadual di atas mewakili korelasi Pearson , yang memfokuskan pada hubungan linear antara semua pembolehubah ini. 

Tetapi jika kita tidak pasti sama ada pembolehubah kita berkorelasi linear sepenuhnya, kita boleh menggunakan jenis korelasi yang berbeza yang lebih memfokuskan pada impak daripada bahagian linear. Ia dipanggil korelasi Spearman

Korelasi Python: Panduan Mencipta Visual

Dan kita boleh melihat maklumat tentang semua perkara ini dengan menekan Shift + Tab. Jika anda tatal ke bawah, kami dapat melihat korelasi pangkat Spearman, pekali korelasi Pearson dan banyak cara berbeza untuk mengukur data kami. 

Korelasi Python: Panduan Mencipta Visual

Melihat kembali kepada matriks korelasi kami sebelum ini, kami tahu bahawa harga dan karat berkorelasi dengan baik.

Korelasi Python: Panduan Mencipta Visual

Ia adalah dari plot kami di sini menunjukkan bahawa ia agak linear pada 0.92. 

Korelasi Python: Panduan Mencipta Visual

Sekarang jika kita menggunakan korelasi Spearman sebaliknya, impak atau pangkat akan menjadi lebih tinggi sedikit pada 0.96.

Korelasi Python: Panduan Mencipta Visual

Jenis korelasi yang berbeza ini membolehkan kita mengambil sifat korelasi yang berbeza antara pembolehubah tersebut. 

Korelasi Pembolehubah Berbilang x Tunggal

Kadang-kadang, kita tidak mahu melihat matriks kerana kita lebih mengambil berat tentang korelasi semua pembolehubah dengan satu pembolehubah sahaja (cth, harga).

Apa yang boleh kita lakukan ialah mengasingkan harga menggunakan dataset.corr diikuti dengan 'price'

Korelasi Python: Panduan Mencipta Visual

Sekarang, kita dapat melihat bahawa harga dikaitkan dengan semua pembolehubah berangka kami yang berbeza dalam jadual ini. Dan sebab kita mungkin mahu melakukan ini adalah untuk plot visual. 

Jadi mari kita lihat pada menggambarkan matriks korelasi kita dengan peta haba.

Korelasi Python: Mencipta Peta Haba

Kita boleh menghantar pembolehubah korelasi ini ke dalam peta haba Seaborn menggunakan fungsi sns.peta haba.

Korelasi Python: Panduan Mencipta Visual

Ini akan memberi kita peta haba yang kelihatan seperti ini.

Korelasi Python: Panduan Mencipta Visual

Sekali lagi, kita boleh menambah parameter pada keutamaan kita. Kita boleh memasukkan parameter linewidths=1 dan menambah anotasi menggunakan annot=True

Korelasi Python: Panduan Mencipta Visual

Dan anda dapat melihat bahawa peta haba kami kini kelihatan agak berbeza. Sekarang kami mempunyai peta haba yang cukup bagus. 

Korelasi Python: Panduan Mencipta Visual

Kita dapat melihat kegunaan menambah baris dan anotasi. Sekali lagi, jika kita menekan Shift + Tab, semua parameter berbeza yang boleh masuk ke dalamnya akan dipaparkan. 

Seterusnya, cuba tambah method='spearman ' dalam kod kami, supaya anda tahu cara menggunakan jenis korelasi yang berbeza bergantung pada kes penggunaan anda. 

Korelasi Python: Panduan Mencipta Visual

Peta Haba Dengan Satu Pembolehubah

Seterusnya, kami mengasingkan satu pembolehubah dan mencipta peta haba dengan korelasi daripada negatif kepada positif.

Korelasi Python: Panduan Mencipta Visual

Ini akan memberikan kami peta haba ini di bawah.

Korelasi Python: Panduan Mencipta Visual

Kami pasti boleh mengubah gaya juga. Sebagai contoh, kita boleh menggunakan parameter cmap sebagai cmap='coolwarm' . Ini menukar warna kepada sejuk dan hangat, dan akan menghapuskan latar belakang hitam kami juga. 

Korelasi Python: Panduan Mencipta Visual

Jika kita klik Run , kita akan mendapat peta haba ini di bawah. Untuk sejuk, kami mempunyai biru dan kemudian untuk hangat, kami mempunyai bar merah. 

Korelasi Python: Panduan Mencipta Visual

Kami juga boleh menukar arah untuk menjajarkan peta kami dengan bar warna. Ini dilakukan dengan mengedit parameter sort_values ​​kami dan menambah ascending=False

Korelasi Python: Panduan Mencipta Visual

Ini akan pergi daripada yang paling berkorelasi (bar merah) kepada yang paling kurang berkorelasi (bar biru). 

Korelasi Python: Panduan Mencipta Visual

Korelasi Python: Mencipta Visual Tangga

Satu cara lanjutan untuk menggambarkan korelasi kami adalah dengan menggunakan topeng untuk menyekat semua korelasi yang telah kami lakukan. 

Kita boleh melakukan ini dengan Numpy, menggunakan beberapa fungsi TRUE dan FALSE untuk membuat visual tangga untuk korelasi kita. 

Korelasi Python: Panduan Mencipta Visual

Begini rupa hasilnya.

Korelasi Python: Panduan Mencipta Visual

Mari lihat bagaimana kita boleh menyalurkannya ke LuckyTemplates.

Visual Tangga dalam LuckyTemplates

Pertama, buka LuckyTemplates. Saya telah membawa set data alpukat supaya kita dapat melihat visual yang berbeza. Anda boleh melihat set data ini di bawah anak tetingkap Fields. Mulakan visual Python dengan mengklik pada ikon Python di bawah anak tetingkap Visualisasi. 

Korelasi Python: Panduan Mencipta Visual

Kita perlu mencipta set data dengan menambah semua pembolehubah berangka yang ditunjukkan dengan ? . Tambahkannya dengan mengklik kotak semak di sebelah pembolehubah ini. 

Korelasi Python: Panduan Mencipta Visual

Sekarang setelah kami mempunyai set data, kami boleh pergi ke buku nota Jupyter kami dan menyalin kod ini yang kami ada sebelum ini.

Korelasi Python: Panduan Mencipta Visual

Kemudian, kami akan menyalin kod ke editor skrip Python dalam LuckyTemplates. 

Korelasi Python: Panduan Mencipta Visual

Seterusnya, kami akan memilih visual kami, yang akan menjadi visual tangga. Kami akan kembali ke Jupyter, salin kod yang kami gunakan untuk visual tangga kami.

Korelasi Python: Panduan Mencipta Visual

Tampalkan kod ke dalam editor skrip Python.

Korelasi Python: Panduan Mencipta Visual

Perkara terakhir yang perlu dilakukan ialah pastikan kami menggunakan plt.show , yang diperlukan dalam skrip Python anda. Tambahkan plt.show pada baris terakhir kod dan klik ikon jalankan di penjuru kanan sebelah atas editor skrip.

Korelasi Python: Panduan Mencipta Visual

Untuk visual yang lebih besar, rentangkan sedikit kotak supaya kita dapat melihat skrip berjalan di sudut. Kami mempunyai visual kami untuk peta haba kami, yang kelihatan agak bagus.

Korelasi Python: Panduan Mencipta Visual

Dan dalam LuckyTemplates, kita pasti dapat melihat bagaimana visual itu mungkin berubah mengikut set data. Sebagai contoh, kita boleh mengklik ikon Slicer dalam anak tetingkap Visualisasi dan pergi ke Taip dalam anak tetingkap Medan. 

Ia akan memberi kami dua jenis dalam set data kami, konvensional dan organik . Jika kita mengklik satu jenis, katakan organik , anda boleh melihat bahawa peta haba berubah. 

Korelasi Python: Panduan Mencipta Visual

Perubahan juga akan dikenakan apabila kita mengklik pada jenis konvensional seterusnya.

Korelasi Python: Panduan Mencipta Visual

Ingat bahawa kita perlu mempunyai pembolehubah kategori dalam set data skrip Python kami untuk membuat penapis ini berfungsi. Seperti yang kita lihat, set data yang kami buat termasuk jenis , membolehkan kami menapis visual dengan cara itu. 

Korelasi Python: Panduan Mencipta Visual


Membina Perhubungan Model Data Anda Dalam
Analisis Teks LuckyTemplates Dalam Python | Skrip Python Pengenalan
Dalam Laporan Data LuckyTemplates

Kesimpulan

Dalam blog ini, anda mempelajari cara untuk menggambarkan korelasi dalam Python dan LuckyTemplates menggunakan kaedah yang berbeza seperti korelasi Pearson dan korelasi pangkat Spearman. 

Kini, anda boleh membuat plot serakan, plot regresi, matriks korelasi, peta haba dan visual tangga untuk mendapatkan visual terbaik untuk set data anda. Anda juga boleh menggunakan pelbagai parameter untuk menambah baik gaya dan visual. 

Semua yang terbaik,


Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.

Pelaporan Perniagaan Menggunakan LuckyTemplates

Pelaporan Perniagaan Menggunakan LuckyTemplates

Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu