Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Tutorial ini adalah kesinambungan perbincangan tentang pakej dplyr . Anda akan belajar cara menyusun, menapis dan mengumpulkan baris dalam R.
Pelajaran sebelumnya adalah mengenai operasi lajur. Kali ini, tumpuan akan diberikan pada operasi baris dalam dplyr .
Kami akan merangkumi perkara asas yang termasuk mengisih dan menapis set data serta mengagregat dan meringkaskan rekod . Untuk memberi anda gambaran keseluruhan tentang perkara yang diharapkan untuk pelajaran ini, fikirkan jadual pangsi dalam MS Excel.
Isi kandungan
Bermula
Buka skrip R baharu dalam RStudio.
Sama seperti pelajaran operasi lajur, demonstrasi ini akan menggunakan pakej set data Lahman . Muat turun dengan membuat carian google pantas.
Untuk membawa pakej Lahman ke dalam R, jalankan perpustakaan (Lahman) . Untuk mendayakan pakej dplyr , jalankan perpustakaan (tidyverse) . Selain itu, ingat bahawa amalan terbaik untuk menamakan konvensyen dalam R adalah menggunakan huruf kecil jadi tetapkan Pasukan ke dalam pasukan .
Fungsi Asas Untuk Operasi Baris
1. Susun Baris Dalam R
Operasi baris pertama dalam dpylr ialah susun ( ) . Fungsi ini membolehkan anda menyusun semula baris. Ia berfungsi dengan terlebih dahulu mengatur bingkai data df dan kemudian medan yang diberikan.
Sebagai contoh, mari isi mengikut teamID . Run arrange (pasukan, teamID) .
Jika anda mahu ia disusun dalam tertib menurun, anda perlu menggunakan fungsi desc ( ) .
Sebagai contoh, jika anda ingin mengisih mengikut tahun dalam tertib menurun, jalankan arrange (teams, desc(yearID)) .
Apabila anda melakukan ini, anda tidak menyerahkan output kembali kepada pasukan . Anda hanya melihat hasilnya dalam Konsol.
Ia juga mungkin untuk mengisih mengikut berbilang kriteria. Contohnya, jika anda ingin mengisih mengikut teamID dan kemudian yearID dalam tertib menurun, anda hanya perlu menjalankan kod ini:
Apabila anda mengisih baris, anda tidak menukar data. Data hanya dialihkan. Tiada apa-apa yang ditambah atau dialih keluar.
2. Tapis Baris Dalam R
Fungsi penapis ( ) menambah atau mengalih keluar data bergantung pada kriteria yang dipilih. Kod asasnya ialah:
Sebagai contoh, mari dapatkan semua data dengan ID tahun lebih besar daripada atau sama dengan 2000. Ikut format fungsi penapis dan masukkan maklumat yang diperlukan. Kemudian, jalankannya. Jangan lupa untuk menetapkan ini kepada objek baharu. Dalam kes ini, ia telah diberikan kepada moden .
Untuk menyemak sama ada baris memang ditapis, anda boleh menggunakan fungsi dim ( ) . Ia memberikan bilangan baris dan lajur dalam bingkai data.
Jika anda menjalankan dim (pasukan) , anda akan melihat bahawa bingkai data mempunyai 2,955 baris dan 48 lajur.
Jika anda menjalankan fungsi malap pada moden , anda akan melihat bahawa bilangan baris telah dikurangkan kepada 630 manakala bilangan lajur kekal sama.
Baris telah dipotong kerana beberapa rekod melebihi tahun 2000.
Anda juga boleh menapis baris mengikut berbilang medan dalam R. Anda perlu menggunakan pernyataan AND dan OR .
Sebagai contoh, mari kita menapis pasukan mengikut kawasan. Dalam kes ini, objek baharu ohio dicipta. Kriteria penapis ialah teamID hanya perlu memasukkan Cleveland DAN Cincinnati.
Anda perlu menggunakan tanda sama berganda ( == ) untuk menyemak kesamaan. Jika anda hanya menggunakan satu tanda sama, R akan menganggapnya sebagai pengendali tugasan. Gunakan ampersand ( & ) untuk mewakili DAN.
Untuk menyemak, gunakan fungsi dim . Anda akan melihat bahawa bilangan baris ialah 0.
Ini bermakna bahawa tidak ada mana-mana pasukan di mana mereka berdua berpangkalan di Cleveland dan Cincinnati.
Seterusnya, mari cuba Cleveland ATAU Cincinnati. Operator OR diwakili oleh operator paip ( | ). Jadi, apa yang anda perlu lakukan ialah menggantikan ampersand dengan pengendali paip dan kemudian jalankannya. Selepas itu, jalankan fungsi malap semula.
Anda akan melihat bahawa terdapat 251 baris dan bukannya sifar.
Sekarang bagaimana jika anda terlupa menggunakan tanda sama banyak dan sebaliknya menggunakan hanya satu? Inilah yang berlaku:
RStudio akan menunjukkan mesej ralat yang sangat membantu dalam Konsol yang mengingatkan anda untuk menggunakan tanda sama banyak.
3. Kumpulkan Mengikut Dan Ringkaskan Baris Dalam R
Fungsi kumpulan mengikut ( ) membolehkan anda mengagregatkan rekod mengikut lajur yang dipilih dan kemudian berdasarkan pengagregatan itu, meringkaskan lajur lain.
Fungsi kumpulan dengan ( ) mengikut algoritma ini:
Sebagai contoh, mari kumpulkan mengikut teamID dan tetapkan ia kepada objek baharu. Dalam kes ini, objek baharu dipanggil teams_ID . Kemudian, cetaknya.
Dalam Console, anda akan perasan bahawa baris pertama mengatakan ia adalah tibble .
Tibble ialah penambahbaikan yang rapi ke atas bingkai data asas. Ia adalah ciri dalam pakej yang menambah dan menambah baik perkara yang tersedia di luar kotak.
Baris kedua ialah Kumpulan . Jadi, data kini dikumpulkan mengikut lajur teamID.
Dan dengan itu, anda kini boleh menggunakan fungsi ringkasan ( ) pada kumpulan tersebut.
Nota: fungsi ringkasan boleh sama ada dengan s atau z, dan bergantung pada penggunaan bahasa Inggeris British atau Amerika.
Sebagai contoh, mari kita ringkaskan teams_ID dan dapatkan beberapa statistik ringkasan asas. Mari cari min, minimum dan maksimum Kemenangan untuk setiap pasukan. Ingat untuk menyerlahkan keseluruhan kod sebelum memilih untuk Jalankan .
Anda kemudian boleh melihat dalam Konsol bahawa ringkasan statistik setiap pasukan dipaparkan. Ini sangat serupa dengan jadual pangsi tempat anda mengagregat dan meringkaskan data.
Bingkai Data Dalam R: Mempelajari Tahap Faktor Asas
Dalam R: Menggunakan Pembolehubah Kategori & Ordinal
Tambah, Alih & Namakan Semula Lajur Dalam R Menggunakan dplyr
Kesimpulan
Untuk meringkaskan, dua operasi dalam dplyr telah dibincangkan. Tutorial sebelumnya memfokuskan pada operasi lajur. Sementara itu, pelajaran semasa ini menunjukkan kepada anda cara melaksanakan operasi baris menggunakan pakej dplyr dalam RStudio. Secara khusus, anda mempelajari cara menyusun, menapis dan mengumpulkan baris dalam R.
Perkara seterusnya yang perlu dipelajari ialah cara menggabungkan kedua-dua operasi ini. Menggunakan semua fungsi yang telah anda pelajari setakat ini akan sangat membantu anda dalam mencipta kod dalam R. Walau bagaimanapun, teknik yang lebih membantu ialah saluran paip. Ini akan membantu semuanya mengalir bersama. Jadi, pastikan anda menyemak tutorial seterusnya juga.
Apa Itu Diri Dalam Python: Contoh Dunia Sebenar
Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.
Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.
Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.
Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.
Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.
Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.
Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.
Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.
Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu