Set Data Python: Menggunakan Kod Boleh Diulang

Set Data Python: Menggunakan Kod Boleh Diulang

Dalam blog ini, anda akan belajar cara menggunakan kod atau fungsi yang boleh diulang pada set data Python untuk menghasilkan jenis output yang sama. Ini akan membantu anda menjadi lebih cekap dan mengurangkan usaha dalam menarik data tertentu daripada set data yang berbeza. Dalam tutorial ini, kita akan menggunakan kod sedia ada yang telah saya buat sebelum ini sebagai contoh.

Anda juga akan belajar cara membuat salinan set data untuk mengelak daripada merosakkan versi asal set data, mengimport perpustakaan dan fungsi menggunakan kod boleh berulang dan membuat visualisasi dalam LuckyTemplates .

Untuk blog ini, saya mengesyorkan anda untuk mendapatkan fail CSV sepanjang masa dan membawanya ke LuckyTemplates. Saya juga akan menunjukkan cara kami boleh membawa fail CSV ini dan meletakkannya terus ke dalam LuckyTemplates, sekiranya anda perlu melakukannya.

Isi kandungan

Mengambil Fail CSV Dalam LuckyTemplates

Untuk membawa fail CSV ke LuckyTemplates, perkara pertama yang anda perlu lakukan ialah klik pada menu “ Dapatkan Data ” dalam reben Laman Utama .

Set Data Python: Menggunakan Kod Boleh Diulang

Selepas mengklik, menu lungsur turun akan muncul dan anda perlu memilih pilihan " Teks/CSV " daripada menu.

Set Data Python: Menggunakan Kod Boleh Diulang

Sebaik sahaja anda memilih pilihan " Teks/CSV ", tetingkap akan dibuka di mana kami boleh memilih fail yang ingin kami bawa ke dalam LuckyTemplates. Untuk contoh ini, mari kita gunakan fail Set Data IMDB

Set Data Python: Menggunakan Kod Boleh Diulang

Apabila membuka fail Dataset.csv IMDB , anda akan melihat tetingkap lain yang memaparkan data di dalam fail tersebut. Memandangkan fail ini mengandungi sejumlah besar data, ia hanya mempratonton beberapa data.

Perkara pertama yang akan kita lakukan dalam fail ini ialah mengubahnya. Untuk melakukan itu, cuma klik pada pilihan " Transform Data " di bahagian bawah sebelah kanan tetingkap.

Set Data Python: Menggunakan Kod Boleh Diulang

Membuat Salinan Set Data Python

Sebelum kami membuat sebarang perubahan pada set data ini, adalah penting untuk membuat salinan set data asal. Untuk melakukan ini, hanya klik kanan pada set data. 

Set Data Python: Menggunakan Kod Boleh Diulang

Kemudian daripada menu, pilih " Salin ".

Set Data Python: Menggunakan Kod Boleh Diulang

Akhir sekali, klik kanan pada panel Pertanyaan kemudian pilih " Tampal " daripada pilihan.

Set Data Python: Menggunakan Kod Boleh Diulang

Selepas menggunakan langkah-langkah ini, anda harus mempunyai salinan Set Data IMDB asal dalam panel Pertanyaan .

Set Data Python: Menggunakan Kod Boleh Diulang

Mengubah Set Data Dengan Menjalankan Skrip Python

Dengan menukar fail CSV, anda akan dapat memecahkan sejumlah besar set data Python kepada yang lebih kecil. Kita boleh melakukannya dengan menggunakan beberapa skrip Python dalam fail ini.

Tetapi pertama, kita perlu memastikan bahawa pengepala disusun dengan betul. Klik pada menu Laman Utama kemudian cari pilihan " Gunakan Baris Pertama sebagai Pengepala " dan klik padanya.

Set Data Python: Menggunakan Kod Boleh Diulang

Selepas mengklik pilihan " Gunakan Baris Pertama sebagai Pengepala ", pengepala kini bertukar menjadi data daripada baris pertama sebelumnya iaitu " semakan " dan " sentimen ".

Set Data Python: Menggunakan Kod Boleh Diulang

Seterusnya, pergi ke menu Transform dan klik pada pilihan " Jalankan Skrip Python " dalam kumpulan pilihan " Skrip ".

Set Data Python: Menggunakan Kod Boleh Diulang

Selepas itu, tetingkap " Jalankan Skrip Python " akan muncul. Dalam tetingkap ini, anda boleh menjalankan mana-mana skrip Python yang anda mahu untuk mengubah fail semasa yang anda gunakan. Untuk contoh ini, saya akan menjadikan set data lebih kecil dengan menjalankan kod berikut.

Set Data Python: Menggunakan Kod Boleh Diulang

Saya menggunakan fungsi .iloc pada set data untuk memilih baris dan lajur tertentu daripada Set Data IMDB. Kemudian, dalam parameter, saya memilih semua 500 baris pertama dan semua lajur dalam Set Data IMDB. Saya menyimpannya dalam pembolehubah bernama " set data ".

Selepas melaksanakan skrip, kita harus melihat "set data" yang merupakan pembolehubah yang telah kita buat dalam langkah sebelumnya. Ia mengandungi data yang telah kami ubah menggunakan skrip Python.

Set Data Python: Menggunakan Kod Boleh Diulang

Menyemak Set Data

Untuk membuka jadual set data , cuma klik pada " Jadual " di bawah lajur Nilai .

Set Data Python: Menggunakan Kod Boleh Diulang

Kita dapat melihat bahawa set data ini kini turun kepada 500 baris .

Set Data Python: Menggunakan Kod Boleh Diulang

Memandangkan kami telah memecahkan dataset Python kami kepada 500 baris, perkara seterusnya yang akan kami lakukan ialah mengimport perpustakaan yang kami perlukan. Kami akan melakukannya menggunakan prosedur yang sama yang kami lakukan dalam mengubah kandungan Set Data IMDB. Ini adalah untuk memastikan kod kami boleh diurus dalam senario tertentu dengan lebih sedikit perubahan.

Mengimport Perpustakaan Dan Fungsi Menggunakan Kod Boleh Diulang

Untuk mengimport perpustakaan, mari kembali ke buku nota kami dan salin perpustakaan yang kami perlukan. Perlu diingat bahawa sebelum tutorial ini, saya telah mencipta perpustakaan yang akan kami salin ini. Saya hanya menggunakan semula ini untuk anda mendapatkan idea dengan jelas tentang penggunaan fungsi sebagai kod berulang.

Set Data Python: Menggunakan Kod Boleh Diulang

Setelah perpustakaan disalin, tampalkannya ke dalam tetingkap " Jalankan Skrip Python " dan jangan lupa untuk menyertakan baris " daripada Counter import koleksi " di penghujung skrip. 

Set Data Python: Menggunakan Kod Boleh Diulang

Kemudian kami akan menyalin fungsi pembersihan data daripada buku nota kami dan menambahkannya pada skrip Python dalam LuckyTemplates.

Set Data Python: Menggunakan Kod Boleh Diulang

Kami akan menambahkannya di bawah perpustakaan. 

Set Data Python: Menggunakan Kod Boleh Diulang

Kami juga akan menyalin kod untuk memanggil fungsi yang baru kami tambah.

Set Data Python: Menggunakan Kod Boleh Diulang

Kemudian tampalkannya ke dalam skrip Python dalam LuckyTemplates.

Set Data Python: Menggunakan Kod Boleh Diulang

Menjana Jadual Data

Memandangkan kami telah menambahkan kod untuk memanggil fungsi pembersihan data , kami perlu menukar “ df2 ” kepada “ set data ” dan “ tajuk ” kepada “ semakan ”. Kami melakukan ini kerana perubahan yang telah kami buat dalam set data.

Kami menukar "df2" kepada " set data " kerana kami menyimpan data dengan 500 baris dalam "set data". Kemudian untuk "tajuk", kami mengemas kininya kepada "semakan" hasil daripada menukar pengepala lajur.

Dengan penambahan kod ini, kita sepatutnya boleh mendapatkan atau menjana 3 jadual iaitu data1 untuk kekerapan perkataan, data2 untuk kekerapan bigram dan data3 untuk kekerapan trigram.

Set Data Python: Menggunakan Kod Boleh Diulang

Anda juga boleh membuat salinan lain Set Data IMDB (2) yang diubah ini untuk membuka jadual lain kemudian.

Set Data Python: Menggunakan Kod Boleh Diulang

Sekarang dalam Set Data IMDB (2) , mari buka jadual data1

Set Data Python: Menggunakan Kod Boleh Diulang

 Setelah jadual data1 dibuka, kita boleh melihat senarai perkataan serta kekerapan.

Set Data Python: Menggunakan Kod Boleh Diulang

Seperti yang anda lihat, kami dapat melaksanakan prosedur tertentu daripada set data utama dengan menggunakan kod berulang yang kami ambil daripada Buku Nota Jupyter. Dengan kod berulang tersebut, kami dapat mengubah set data Python dan menjana jadual untuk kekerapan perkataan, kekerapan bigram dan kekerapan trigram tanpa menaip kod sekali lagi.

Dalam Set Data IMDB (3) , mari buka jadual data2 untuk melihat kekerapan bigram.

Set Data Python: Menggunakan Kod Boleh Diulang

Dalam jadual kekerapan bigram, anda boleh melihat " br " disertakan dalam senarai. Ini mungkin disambungkan kepada kod HTML. Kami hanya boleh kembali dan menambah sesuatu yang lain tetapi kami tidak akan melakukannya dalam tutorial ini.

Memandangkan data telah dimuatkan dengan bantuan kod yang boleh diulang, kita boleh mula membuat visualisasi mengenainya dalam LuckyTemplates. Contohnya, graf bar untuk kekerapan setiap perkataan. 

Set Data Python: Menggunakan Kod Boleh Diulang


Fungsi Ditakrifkan Pengguna Python | Gambaran Keseluruhan
Senarai Python Dan Untuk Gelung Dalam LuckyTemplates
Menggunakan Python Dalam LuckyTemplates | Set Data Dan Fungsi Rentetan

Kesimpulan

Ringkasnya, kod berulang boleh membantu anda dalam melaksanakan prosedur tertentu pada set data dengan sedikit usaha. Anda telah mempelajari cara menggunakan kod berulang untuk mengubah set data Python dalam LuckyTemplates. Anda juga boleh menggunakan fungsi .iloc untuk menentukan baris dan lajur yang akan dipilih dalam mengubah set data.

Selain itu, anda telah membuat salinan set data dan mencipta visualisasi menggunakan graf bar. Visualisasi ini berdasarkan set data Python yang telah kami buat dan ubah dengan bantuan kod yang boleh diulang.

Semua yang terbaik,

Gaellim


Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.

Pelaporan Perniagaan Menggunakan LuckyTemplates

Pelaporan Perniagaan Menggunakan LuckyTemplates

Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu