การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

ในบล็อกนี้ เราจะแสดงวิธีการวิเคราะห์ข้อความโดยใช้ Python เพื่อระบุส่วนของคำพูดในข้อมูลข้อความภายใน LuckyTemplates เราจะกล่าวถึงขั้นตอนการใช้ Python สำหรับการวิเคราะห์ข้อความและให้ตัวอย่างและคำแนะนำเพื่อช่วยให้คุณเริ่มต้นกับโครงการวิเคราะห์ข้อความของคุณเอง คุณสามารถดูวิดีโอทั้งหมดของบทช่วยสอนนี้ได้ที่ด้านล่างของบล็อกนี้

สารบัญ

แหล่งข้อมูล

ในบทช่วยสอนนี้ เราจะใช้ word cloud แบบสำเร็จรูปซึ่งมีข้อความที่เราจะประเมิน ซึ่งแสดงอยู่ทางด้านซ้ายของภาพด้านล่าง ทางด้านขวา เรามีตัวกรองเพื่อระบุส่วนต่างๆ ของคำพูด ตัวอย่างเช่น คำคุณศัพท์หรือกริยา 

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

เราสามารถกรองคำที่เป็นกริยาวิเศษณ์ คำนาม คำนามหรือกริยาประเภทต่างๆ และฐานกริยา สิ่งนี้มีประโยชน์มากเมื่อสร้างแคมเปญการตลาดและค้นหาคำในบทวิจารณ์ของลูกค้า 

เริ่มต้นด้วยการเปิดตัวแก้ไข  Power Query ของเรา

ในแหล่งข้อมูลของเรา เรามีคอลัมน์สำหรับ ID อายุ ชื่อเรื่อง และข้อความรีวิว เราจะมุ่งเน้นไปที่ คอลัมน์ ข้อความรีวิวและเราจะแยกวิเคราะห์เพื่อทำการวิเคราะห์ข้อความของเรา นอกจากนี้ยังมีหมวดหมู่อื่น ๆ ที่อาจเป็นประโยชน์ในการวิเคราะห์ของเรา

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

การวิเคราะห์ข้อความโดยใช้ Python

เริ่มจากข้อมูลปกติที่เรานำเข้ามา สิ่งแรกที่เราจะทำคือกรองแถวเพราะเรามีข้อมูลจำนวนมาก และเมื่อเราทำการวิเคราะห์ข้อความก็ต้องใช้เวลา 

ในการกรองข้อมูลของเรา ให้ใช้ 50 แถวแรกเพื่อทำให้การวิเคราะห์ข้อความเร็วขึ้นเล็กน้อย 

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

เมื่อกรองออกแล้ว ให้ไปที่Transform and Run Python script เราจะเขียนโค้ดทุกอย่างที่นี่เพราะโค้ดมีไม่มาก 

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

การนำเข้าแพ็คเกจ

มารวมสองแพ็คเกจสำหรับการวิเคราะห์ข้อความ Python โดยใช้ตัวแก้ไขสคริปต์ Python ของเรา เราจะ"นำเข้าแพนด้าเป็น pd"ซึ่งเป็นไลบรารีการจัดการข้อมูลของเราที่จะบันทึกเป็นตัวแปร pd จากนั้น " จากtext blob "เราจะ " นำเข้า TextBlob"โดยมีตัวพิมพ์ใหญ่อยู่ระหว่างคำ 

เราสามารถบันทึกสิ่งที่เรากำลังทำอยู่เสมอโดยใส่สตริงเอกสาร มาเขียน#bring ในไลบรารีที่จำเป็นบนแพ็คเกจของเรา

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

การเปลี่ยนชื่อตัวแปร

ในบรรทัดแรกของสคริปต์ของเรา มีบรรทัดนี้ที่จัดทำโดย LuckyTemplates ที่ระบุว่า# 'ชุดข้อมูล' เก็บข้อมูลอินพุตสำหรับสคริปต์นี้ บรรทัดนี้บอกว่าข้อมูลของเราเรียกว่าชุดข้อมูล 

ดังนั้นขอเปลี่ยนเนื่องจากการเขียน "ชุดข้อมูล" ใช้เวลานานเกินไป พิมพ์#change ตัวแปร datasetและdf = datasetในบรรทัดถัดไป

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

ตอนนี้การเขียนตัวแปรของเราสั้นลง 

ทำการวิเคราะห์ข้อความ

เรามาวิเคราะห์ข้อความกันต่อ โปรดจำไว้ว่าข้อความทบทวนของเราอยู่ในคอลัมน์ที่มีแต่ละเซลล์ การตั้งค่านี้ไม่เป็นประโยชน์สำหรับเราจริงๆ เนื่องจากเราต้องการรวมข้อความทั้งหมดไว้ด้วยกัน เพื่อที่เราจะสามารถทำการวิเคราะห์ได้ 

อย่างไรก็ตาม เราไม่ต้องการให้รวมเข้าด้วยกันโดยไม่มีช่องว่าง ดังนั้นเรามาเริ่มโค้ดของเราด้วยการเว้นวรรคภายในเครื่องหมายอัญประกาศคู่  

จากนั้นมาเพิ่ม.joinและแยกคอลัมน์ข้อความรีวิวโดยใช้ ตัวแปร dfซึ่งเก็บชุดข้อมูล พิมพ์'ข้อความรีวิว'วางไว้ในเครื่องหมายวงเล็บซึ่งแยกคอลัมน์ 

รหัสนี้จะรวมทุกอย่าง แต่เราต้องบันทึกดังนั้นมาสร้างตัวแปรที่เรียกว่าคำ

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

เมื่อเรารวมคำศัพท์ทั้งหมดเข้าด้วยกันแล้ว เราก็สามารถใช้ text blob เพื่อเริ่มวิเคราะห์คำศัพท์ได้ 

สิ่งแรกที่ต้องทำคือสร้างส่วนของคำพูดโดยใช้ ตัวแปร หยดซึ่งเราจำเป็นต้องส่งคำไปยังหยดข้อความ เราจะใช้ข้อความหยดนั้นและส่งผ่านข้อความ ซึ่งก็คือคำพูดของ เรา สิ่งนี้ถูกพิมพ์เป็นblob = TextBlob (คำ)

ตอน นี้เรามี blob นั้นแล้ว เราจะนำมันมาสร้างตัวแปรparts_of_speech โดยใช้ blob.tags แท็กจะเป็นตัวย่อสำหรับแต่ละส่วนของคำพูด 

สิ่งที่เราจะทำต่อไปคือบันทึกสิ่งนี้เป็น data frame โดยใช้Pandas  ที่เรานำเข้ามา เรียกมันว่าข้อมูล ของเรา ซึ่งเท่ากับpd.DataFrameและเรากำลังนำpart_of_speech ของเราเข้ามา

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

คลิกตกลงเพื่อรันโค้ดของเรา หลังจากรันโค้ดแล้ว เราควรจะได้ตารางของตัวแปรของเรา เรามีชุดข้อมูลหรือข้อมูลเดิมของเรา เรายังมีข้อมูลของ  เรา และdf

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

หากคุณไม่ได้ผลลัพธ์ตามที่ตั้งใจไว้ เราจะแสดงวิธีต่างๆ เพื่อหลีกเลี่ยงข้อผิดพลาดที่คุณอาจได้รับในโค้ด

แก้ไขรหัสสำหรับการวิเคราะห์ข้อความใน Python

บางครั้ง เราอาจต้องมีความชัดเจนมากในการเปลี่ยนรูปแบบของข้อความที่เกี่ยวข้อง 

เราสามารถทำได้โดยการเรียก ตัวแปร dfแยก' Review Text ' ที่อยู่ในวงเล็บ จากนั้นเปลี่ยนประเภทเป็นสตริงโดยใช้.astype('str') จากนั้นบันทึกซ้ำอีกครั้งในตัวแปร  df

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

คลิกตกลงเพื่อรันโค้ดอีก ครั้ง เราควรได้รับผลลัพธ์เช่นเดียวกับที่เราได้รับก่อนหน้านี้

ตอนนี้เราต้องการเปิดข้อมูล ของเรา ตัวแปรสุดท้ายที่เรานำเข้ามาเพื่อดูว่ามีลักษณะอย่างไร 

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

เราควรแยกคำพูดทั้งหมดออกเป็นส่วนๆ ของคำพูด เรายังไม่ได้ตั้งชื่อคอลัมน์ของเรา แต่เราสามารถทำได้ง่ายๆ 

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

ในการวิเคราะห์ข้อความเดียวกันนี้ในเวอร์ชันเก่า ฉันเรียกคอลัมน์แรกว่าWordและคอลัมน์ที่สองว่า  Abbreviation

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

ใน แบบสอบถาม Parts of Speechเรานำคำจริงที่มีไว้สำหรับตัวย่อเหล่านี้เข้ามาและเชื่อมโยงทั้งหมดเข้าด้วยกัน

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

ตอนนี้มาปิด & สมัครกันเถอะ 

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด

ขั้นตอนที่เราทำช่วยให้เรากรองส่วนต่างๆ ของคำพูดที่เราระบุได้โดยใช้โค้ดPython แบบง่ายๆ มันทำให้เราเห็นภาพนี้ใน LuckyTemplates ซึ่งเราสามารถกรองข้อความของเราตามประเภทของคำพูดที่อยู่ในหมวดหมู่ได้อย่างง่ายดาย 

การวิเคราะห์ข้อความโดยใช้ Python: วิธีระบุส่วนของคำพูด


การวิเคราะห์ข้อความใน Python | บทนำ
Python User Defined Functions | รายการ Python ภาพรวม
และสำหรับลูปใน LuckyTemplates

บทสรุป

ในฐานะนักวิเคราะห์ข้อมูลคุณอาจพบกับความจำเป็นในการดึงข้อมูลเชิงลึกและความหมายจากข้อมูลข้อความที่ไม่มีโครงสร้างจำนวนมาก สิ่งที่คุณได้เรียนรู้เป็นแนวทางที่มีประโยชน์ในการทำความเข้าใจข้อมูลข้อความผ่านการวิเคราะห์ข้อความ

ตอนนี้ คุณสามารถแยกข้อความออกเป็นหน่วยย่อยๆ เช่น คำและประโยค จากนั้นวิเคราะห์หน่วยเหล่านี้เพื่อหารูปแบบและความสัมพันธ์ คุณสามารถบรรลุเป้าหมายเหล่านี้ได้โดยใช้การวิเคราะห์ข้อความใน Python และ LuckyTemplates 

สิ่งที่ดีที่สุด


ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

วิธีบันทึกและโหลดไฟล์ RDS ใน R

วิธีบันทึกและโหลดไฟล์ RDS ใน R

คุณจะได้เรียนรู้วิธีการบันทึกและโหลดวัตถุจากไฟล์ .rds ใน R บล็อกนี้จะครอบคลุมถึงวิธีการนำเข้าวัตถุจาก R ไปยัง LuckyTemplates

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

ในบทช่วยสอนภาษาการเข้ารหัส DAX นี้ เรียนรู้วิธีใช้ฟังก์ชัน GENERATE และวิธีเปลี่ยนชื่อหน่วยวัดแบบไดนามิก

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

บทช่วยสอนนี้จะครอบคลุมถึงวิธีการใช้เทคนิค Multi Threaded Dynamic Visuals เพื่อสร้างข้อมูลเชิงลึกจากการแสดงข้อมูลแบบไดนามิกในรายงานของคุณ

บทนำในการกรองบริบทใน LuckyTemplates

บทนำในการกรองบริบทใน LuckyTemplates

ในบทความนี้ ฉันจะเรียกใช้ผ่านบริบทตัวกรอง บริบทตัวกรองเป็นหนึ่งในหัวข้อหลักที่ผู้ใช้ LuckyTemplates ควรเรียนรู้ในขั้นต้น

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

ฉันต้องการแสดงให้เห็นว่าบริการออนไลน์ของ LuckyTemplates Apps สามารถช่วยในการจัดการรายงานและข้อมูลเชิงลึกต่างๆ ที่สร้างจากแหล่งข้อมูลต่างๆ ได้อย่างไร

วิเคราะห์การเปลี่ยนแปลงอัตรากำไรล่วงเวลา – การวิเคราะห์ด้วย LuckyTemplates และ DAX

วิเคราะห์การเปลี่ยนแปลงอัตรากำไรล่วงเวลา – การวิเคราะห์ด้วย LuckyTemplates และ DAX

เรียนรู้วิธีคำนวณการเปลี่ยนแปลงอัตรากำไรของคุณโดยใช้เทคนิคต่างๆ เช่น การแยกสาขาและการรวมสูตร DAX ใน LuckyTemplates

แนวคิด Materialization สำหรับแคชข้อมูลใน DAX Studio

แนวคิด Materialization สำหรับแคชข้อมูลใน DAX Studio

บทช่วยสอนนี้จะหารือเกี่ยวกับแนวคิดของการทำให้แคชข้อมูลเป็นรูปธรรมและวิธีที่สิ่งเหล่านี้ส่งผลต่อประสิทธิภาพของ DAX ในการให้ผลลัพธ์

การรายงานทางธุรกิจโดยใช้ LuckyTemplates

การรายงานทางธุรกิจโดยใช้ LuckyTemplates

หากคุณยังคงใช้ Excel อยู่จนถึงตอนนี้ นี่เป็นเวลาที่ดีที่สุดในการเริ่มใช้ LuckyTemplates สำหรับความต้องการในการรายงานทางธุรกิจของคุณ

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้