การตัดคำใน Python | คู่มือสำหรับผู้เริ่มต้น

ในบทช่วยสอนนี้ เราจะพูดถึงการย่อคำในPythonซึ่งเป็นวิธีที่ใช้สำหรับจัดกลุ่มองค์ประกอบต่างๆ ของคำเข้าด้วยกัน การย่อคำยังมีจุดมุ่งหมายเพื่อลดการผันคำและเน้นที่การให้รากศัพท์หรือรูปฐานของคำซึ่งเป็นความหมาย ของคำว่าคำ แทรก

สารบัญ

Lemmatization Vs Stemming

การย่อคำนั้นคล้ายกับการสะกดคำซึ่งทำหน้าที่ลดการผันคำ ข้อแตกต่างเพียงอย่างเดียวคือการใช้คำตามพจนานุกรมเป็นผลลัพธ์

ในทางกลับกันการสะกดคำจะลบเฉพาะคำที่ต่อท้ายออกจากคำที่ผันออกมา ซึ่งอาจส่งผลให้คำนั้นไม่มีอยู่จริง

ตัวอย่างเช่น ถ้าเราใช้การผูกรากศัพท์กับคำว่าศึกษาก็จะทำให้คำว่าศึกษาเป็นผลลัพธ์ เนื่องจากมีวัตถุประสงค์เพื่อลบคำต่อท้ายes ออก จากคำว่าศึกษา

ในทางกลับกัน หาก ใช้ ตัวย่อก็จะได้ผลลัพธ์เป็นการศึกษาคำ เนื่องจากเน้นที่การให้รูปฐานของคำ

สิ่งที่ต้องพิจารณาในการใช้ตัวย่อ

  • มันใช้คำตามพจนานุกรม ด้วยคำว่าlemmaซึ่งหมายถึงรากหรือรูปแบบฐานของคำ การแยกย่อยมีจุดมุ่งหมายเพื่อให้รูปแบบฐานของคำมากกว่าแค่การลบการผันของคำ
  • มันขึ้นอยู่กับส่วนของคำพูดเพื่อค้นหาคำพื้นฐาน โดยไม่ระบุส่วนของคำพูด) การแยกย่อยอาจทำงานได้ไม่ดี และคุณอาจไม่ได้ผลลัพธ์ที่คุณต้องการ
  • มันช้ากว่าการสกัดกั้นแต่มีประสิทธิภาพมากกว่า เนื่องจากการเรียงคำไม่ได้เป็นไปตามอัลกอริทึมในการดำเนินการกับคำและความจำเป็นในการให้ส่วนของคำพูด จึงถือว่าช้ากว่าการสะกดคำ อย่างไรก็ตาม มีประสิทธิภาพมากกว่าเมื่อใช้คำตามพจนานุกรมเพื่อผลลัพธ์ 
  • มีความแม่นยำสูงกว่าในการหารากศัพท์ เนื่องจากการใช้คำตามพจนานุกรมในการจัดวางผลลัพธ์จากคำที่ผัน คุณจะมีโอกาสสูงที่จะได้ผลลัพธ์ที่แม่นยำ

ขั้นตอนการเตรียมการสำหรับการย่อใน Python

ก่อนที่เราจะดำเนินการใช้ ตัวย่อ เรามาเริ่มต้นด้วยการนำเข้า ไลบรารี Wordจากtextblob

การตัดคำใน Python |  คู่มือสำหรับผู้เริ่มต้น

หลังจากนั้นเราจะสร้างวัตถุคำ 

การตัดคำใน Python |  คู่มือสำหรับผู้เริ่มต้น

ในการสร้าง word object เราสร้างตัวแปรชื่อw จากนั้นเราเก็บไลบรารี Word ที่เก็บวัตถุคำของเราซึ่งก็คือoctopiรูปพหูพจน์ของคำว่า octopus โปรดทราบว่าเมื่อส่งองค์ประกอบโดยใช้ไลบรารี Word สิ่งสำคัญคือต้องล้อมรอบองค์ประกอบนั้นด้วยเครื่องหมายคำพูดเดี่ยว

เริ่มต้นตัวแปรw ​​เพื่อดูว่ามีวัตถุคำที่เราเพิ่งสร้างขึ้นหรือไม่

การตัดคำใน Python |  คู่มือสำหรับผู้เริ่มต้น

เมื่อดำเนิน การตัวแปร w ​​เราจะได้คำว่าobject octopi

การใช้ Lemmatization ใน Python

ต่อไป เราจะใช้การย่อโดยใช้ฟังก์ชัน  .lemmatize

การตัดคำใน Python |  คู่มือสำหรับผู้เริ่มต้น

ในขั้นตอนนี้ เราใช้ ตัวแปร w ​​ที่เก็บคำว่า object octopiและเราใช้ ฟังก์ชัน .lemmatizeเพื่อใช้ lemmatization เป็นผลให้เราได้คำว่าoctopusซึ่งเป็นรากหรือรูปแบบพื้นฐานของคำว่าoctopi

หลังจากนั้นมาลองใช้การย่อคำกับคำกันดีกว่า .

การตัดคำใน Python |  คู่มือสำหรับผู้เริ่มต้น

ในตัวอย่างก่อนหน้านี้ เราอัปเดตวัตถุคำของเราจากoctopiเป็นดีกว่า จากนั้นเราก็ย่อมันด้วยฟังก์ชัน.lemmatize ดังนั้นผลลัพธ์ที่เราได้รับจึงเหมือนกับคำว่าวัตถุที่เราใช้

ในการใช้ฟังก์ชัน .lemmatize คุณสามารถเปลี่ยนวิธีการย่อคำได้โดยผ่านส่วนหนึ่งของคำพูด ตัวอย่างเช่น ลองส่งaไปยังฟังก์ชัน .lemmatize ซึ่งย่อมาจากคำคุณศัพท์ในส่วนต่าง ๆ ของคำพูด 

การตัดคำใน Python |  คู่มือสำหรับผู้เริ่มต้น

หลังจากเพิ่มส่วนของคำพูดลงในฟังก์ชัน .lemmatize แล้ว เราก็จะได้ผลลัพธ์ ของคำพื้นฐาน ที่ดี

ลองเปลี่ยน word object ของเราเป็นrun อีก ครั้ง เรามาเปลี่ยนส่วนของคำพูดที่เราจะส่งไปยังฟังก์ชัน .lemmatize เป็นvซึ่งย่อมาจากคำกริยา

การตัดคำใน Python |  คู่มือสำหรับผู้เริ่มต้น

หลังจากทำการเปลี่ยนแปลงและเริ่มต้นฟังก์ชัน .lemmatize เราได้รับคำรูทของคำที่รันซึ่งผลที่ตามมา คือ รัน ตัวย่อส่วนใหญ่ไม่สามารถใช้วิธีการที่เราเพิ่งทำในการใช้ฟังก์ชัน .lemmatize ได้

อย่างไรก็ตาม ฟังก์ชัน .lemmatize เป็นเครื่องมือสำคัญที่จะใช้เมื่อทำการวิเคราะห์ข้อความบางประเภทใน Pythonเพื่อให้ได้รูปแบบพื้นฐานของคำ


วิธีการใช้สคริปต์ Python ใน LuckyTemplates
วิธีโหลดชุดข้อมูลตัวอย่างใน Python
Python User Defined Functions | ภาพรวม

บทสรุป

โดยสังเขป เราสามารถเข้าใจการใช้คำย่อในPythonและวิธีการทำงาน เราได้พูดถึงความคล้ายคลึงและความแตกต่างของการย่อคำจากการตัดคำเช่นกัน เรายังสามารถสร้างวัตถุคำโดยใช้ ไลบรารี Wordและวิธีการใช้ฟังก์ชัน.lemmatize

นอกจากนี้ เราได้เรียนรู้วิธีใช้ส่วนต่างๆ ของคำพูดในฟังก์ชัน .lemmatize การใช้ตัวย่อในงานวิเคราะห์ข้อความประจำวันของคุณจะช่วยลดเวลาและความพยายามในการค้นหาคำพื้นฐานของคำเฉพาะได้อย่างมาก

สิ่งที่ดีที่สุด

เกลลิม

Leave a Comment

คู่มือการดาวน์โหลดและติดตั้ง R และ RStudio

คู่มือการดาวน์โหลดและติดตั้ง R และ RStudio

ค้นพบวิธีที่เราสามารถดาวน์โหลดและติดตั้ง R และ RStudio ซึ่งเป็นทั้งแบบฟรีและแบบโอเพ่นซอร์สสำหรับการเขียนโปรแกรมสถิติและกราฟิก

วิธีลดขนาดไฟล์ Excel – 6 วิธีที่มีประสิทธิภาพ

วิธีลดขนาดไฟล์ Excel – 6 วิธีที่มีประสิทธิภาพ

วิธีลดขนาดไฟล์ Excel – 6 วิธีที่มีประสิทธิภาพ

Power Automate คืออะไร? - สุดยอดคู่มือ

Power Automate คืออะไร? - สุดยอดคู่มือ

Power Automate คืออะไร? - สุดยอดคู่มือที่ช่วยให้คุณเข้าใจและใช้ได้อย่างมีประสิทธิภาพ

วิธีใช้ Power Query ใน Excel: คู่มือฉบับสมบูรณ์

วิธีใช้ Power Query ใน Excel: คู่มือฉบับสมบูรณ์

วิธีใช้ Power Query ใน Excel: คำแนะนำทั้งหมดเพื่อทำให้ข้อมูลของคุณมีประสิทธิภาพมากขึ้น

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

วิธีบันทึกและโหลดไฟล์ RDS ใน R

วิธีบันทึกและโหลดไฟล์ RDS ใน R

คุณจะได้เรียนรู้วิธีการบันทึกและโหลดวัตถุจากไฟล์ .rds ใน R บล็อกนี้จะครอบคลุมถึงวิธีการนำเข้าวัตถุจาก R ไปยัง LuckyTemplates

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

ในบทช่วยสอนภาษาการเข้ารหัส DAX นี้ เรียนรู้วิธีใช้ฟังก์ชัน GENERATE และวิธีเปลี่ยนชื่อหน่วยวัดแบบไดนามิก

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

บทช่วยสอนนี้จะครอบคลุมถึงวิธีการใช้เทคนิค Multi Threaded Dynamic Visuals เพื่อสร้างข้อมูลเชิงลึกจากการแสดงข้อมูลแบบไดนามิกในรายงานของคุณ

บทนำในการกรองบริบทใน LuckyTemplates

บทนำในการกรองบริบทใน LuckyTemplates

ในบทความนี้ ฉันจะเรียกใช้ผ่านบริบทตัวกรอง บริบทตัวกรองเป็นหนึ่งในหัวข้อหลักที่ผู้ใช้ LuckyTemplates ควรเรียนรู้ในขั้นต้น

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

ฉันต้องการแสดงให้เห็นว่าบริการออนไลน์ของ LuckyTemplates Apps สามารถช่วยในการจัดการรายงานและข้อมูลเชิงลึกต่างๆ ที่สร้างจากแหล่งข้อมูลต่างๆ ได้อย่างไร