Lemmatisasi Dalam Python | Panduan Pemula

Lemmatisasi Dalam Python | Panduan Pemula

Dalam tutorial ini, kita akan membincangkan lemmatisasi dalam Python yang merupakan kaedah yang digunakan untuk mengumpulkan bersama unsur-unsur yang berbeza bagi sesuatu perkataan. Lemmatisasi juga bertujuan untuk mengurangkan infleksi perkataan dan memberi tumpuan kepada penyediaan akar atau bentuk pangkal sesuatu perkataan iaitu maksud perkataan lemma .

Isi kandungan

Lemmatisasi Vs Stemming

Lemmatization sama dengan stemming yang juga berfungsi untuk mengurangkan infleksi dalam perkataan. Satu-satunya perbezaan ialah lemmatisasi menggunakan perkataan berasaskan kamus sebagai hasilnya.

Sebaliknya, stemming hanya mengalih keluar imbuhan daripada perkataan infleksi yang mungkin menghasilkan perkataan yang tidak wujud.

Sebagai contoh, jika kita menggunakan berpunca daripada perkataan kajian , ia akan memberikan perkataan kajian sebagai output kerana ia bertujuan untuk membuang akhiran es daripada perkataan kajian .

Sebaliknya, jika lemmatisasi digunakan, perkataan kajian akan diberikan sebagai hasilnya kerana ia memberi tumpuan kepada penyediaan bentuk dasar sesuatu perkataan.

Perkara Yang Perlu Dipertimbangkan Dalam Menggunakan Lemmatisasi

  • Ia menggunakan perkataan berasaskan kamus. Dengan istilah lemma yang bermaksud akar atau bentuk pangkal sesuatu perkataan, lemmatisasi bertujuan untuk menyediakan bentuk dasar sesuatu perkataan dan bukannya hanya membuang fleksi sesuatu perkataan.
  • Ia bergantung sepenuhnya pada bahagian pertuturan untuk mencari kata dasar. Tanpa menyatakan bahagian pertuturan), lemmatisasi mungkin tidak berfungsi dengan baik dan anda mungkin tidak mendapat hasil yang anda cari.
  • Ia lebih perlahan daripada berpunca tetapi ia lebih berkuasa. Memandangkan lemmatisasi tidak mengikut algoritma untuk melakukan pada perkataan dan keperluan menyediakan bahagian pertuturan, ia dianggap lebih perlahan daripada berpunca. Walau bagaimanapun, ia lebih berkuasa dalam cara menggunakan perkataan berasaskan kamus untuk hasil. 
  • Ia mempunyai ketepatan yang lebih tinggi dalam mencari kata dasar. Memandangkan lemmatisasi menggunakan perkataan berasaskan kamus dalam meletakkan hasil daripada perkataan infleksi, anda akan mempunyai peluang yang lebih tinggi untuk mendapatkan output yang tepat.

Peringkat Persediaan Untuk Lemmatisasi Dalam Python

Sebelum kita meneruskan untuk melaksanakan lemmatisasi, mari kita mulakan dengan mengimport perpustakaan Word daripada textblob .

Lemmatisasi Dalam Python |  Panduan Pemula

Selepas itu, kita akan mencipta objek perkataan. 

Lemmatisasi Dalam Python |  Panduan Pemula

Untuk mencipta objek perkataan, kami mencipta pembolehubah bernama w . Kemudian kami menyimpan perpustakaan Word yang memegang objek perkataan kami iaitu octopi , bentuk jamak bagi perkataan octopus. Ambil perhatian bahawa apabila menghantar elemen menggunakan perpustakaan Word, adalah penting untuk menyertakan elemen tersebut dengan petikan tunggal.

Mari kita mulakan pembolehubah w untuk melihat sama ada ia memegang perkataan objek yang baru kita buat.

Lemmatisasi Dalam Python |  Panduan Pemula

Apabila melaksanakan pembolehubah w , kita mendapat perkataan objek octopi sebagai hasilnya.

Melaksanakan Lemmatisasi Dalam Python

Seterusnya, kita akan melaksanakan lemmatisasi dengan menggunakan fungsi .lemmatize

Lemmatisasi Dalam Python |  Panduan Pemula

Dalam langkah ini, kami menggunakan pembolehubah w yang memegang perkataan objek octopi dan kami menggunakan fungsi .lemmatize untuk menggunakan lemmatisasi. Hasilnya, kami mendapat perkataan sotong yang merupakan akar atau bentuk pangkal perkataan sotong .

Selepas itu, mari cuba gunakan lemmatisasi dengan perkataan better .

Lemmatisasi Dalam Python |  Panduan Pemula

Dalam contoh sebelumnya, kami mengemas kini objek perkataan kami daripada octopi kepada better . Kemudian kami lemmatize dengan fungsi .lemmatize . Oleh itu, hasil yang kami dapat adalah sama dengan perkataan objek yang kami gunakan.

Dalam menggunakan fungsi .lemmatize, anda boleh menukar cara lematisasinya dengan menghantar sebahagian daripada pertuturan. Sebagai contoh, mari cuba hantarkan a kepada fungsi .lemmatize yang bermaksud kata sifat dalam bahagian-bahagian ucapan. 

Lemmatisasi Dalam Python |  Panduan Pemula

Selepas menambah sebahagian daripada pertuturan pada fungsi .lemmatize, kita boleh mendapatkan kata dasar yang baik sebagai hasilnya.

Mari kita tukar objek perkataan kita sekali lagi kepada berjalan . Mari juga tukar bahagian pertuturan yang akan kita salurkan kepada fungsi .lemmatize kepada v yang bermaksud kata kerja.

Lemmatisasi Dalam Python |  Panduan Pemula

Selepas membuat perubahan dan memulakan fungsi .lemmatize, kami mendapat kata dasar perkataan berjalan yang dijalankan sebagai hasilnya. Kebanyakan lemmatizer tidak mampu melaksanakan kaedah yang baru kami lakukan dalam menggunakan fungsi .lemmatize.

Walau bagaimanapun, fungsi .lemmatize ialah alat yang cukup besar untuk digunakan apabila melakukan jenis analisis teks tertentu dalam Python untuk mendapatkan bentuk asas sesuatu perkataan.


Cara Menggunakan Skrip Python Dalam LuckyTemplates
Cara Memuatkan Contoh Dataset Dalam Python
Python Fungsi Ditakrifkan Pengguna | Gambaran keseluruhan

Kesimpulan

Secara ringkasnya, kami dapat memahami penggunaan lemmatisasi dalam Python dan cara ia berfungsi. Kami telah membincangkan persamaan dan perbezaan lematizing daripada stemming juga. Kami juga boleh mencipta objek perkataan menggunakan perpustakaan Word dan cara menggunakan fungsi .lemmatize .

Selain itu, kami telah mempelajari cara menggunakan bahagian pertuturan yang berbeza dalam fungsi .lemmatize. Melaksanakan lemmatisasi dalam tugasan analisis teks harian anda akan sangat membantu anda mengurangkan masa dan usaha dalam mencari kata dasar bagi perkataan tertentu.

Semua yang terbaik,

Gaellim


Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Apa Itu Diri Dalam Python: Contoh Dunia Sebenar

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Cara Menyimpan & Memuatkan Fail RDS Dalam R

Anda akan belajar cara menyimpan dan memuatkan objek daripada fail .rds dalam R. Blog ini juga akan membincangkan cara mengimport objek dari R ke LuckyTemplates.

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

N Hari Perniagaan Pertama Dilawati Semula – Penyelesaian Bahasa Pengekodan DAX

Dalam tutorial bahasa pengekodan DAX ini, pelajari cara menggunakan fungsi GENERATE dan cara menukar tajuk ukuran secara dinamik.

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Pamerkan Cerapan Menggunakan Teknik Visual Dinamik Berbilang Thread Dalam LuckyTemplates

Tutorial ini akan merangkumi cara menggunakan teknik Visual Dinamik Berbilang Thread untuk mencipta cerapan daripada visualisasi data dinamik dalam laporan anda.

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Pengenalan Untuk Menapis Konteks Dalam LuckyTemplates

Dalam artikel ini, saya akan menjalankan konteks penapis. Konteks penapis ialah salah satu topik utama yang perlu dipelajari oleh mana-mana pengguna LuckyTemplates pada mulanya.

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Petua Terbaik Menggunakan Aplikasi Dalam Perkhidmatan Dalam Talian LuckyTemplates

Saya ingin menunjukkan cara perkhidmatan dalam talian LuckyTemplates Apps boleh membantu dalam mengurus laporan dan cerapan berbeza yang dijana daripada pelbagai sumber.

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Analisis Perubahan Margin Keuntungan Lebih Masa – Analitis Dengan LuckyTemplates Dan DAX

Ketahui cara untuk menyelesaikan perubahan margin keuntungan anda menggunakan teknik seperti mengukur percabangan dan menggabungkan formula DAX dalam LuckyTemplates.

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Idea Pewujudan Untuk Cache Data Dalam DAX Studio

Tutorial ini akan membincangkan tentang idea pewujudan cache data dan cara ia mempengaruhi prestasi DAX dalam memberikan hasil.

Pelaporan Perniagaan Menggunakan LuckyTemplates

Pelaporan Perniagaan Menggunakan LuckyTemplates

Jika anda masih menggunakan Excel sehingga sekarang, maka inilah masa terbaik untuk mula menggunakan LuckyTemplates untuk keperluan pelaporan perniagaan anda.

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu

Apakah LuckyTemplates Gateway? Semua yang Anda Perlu Tahu