ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

ในบล็อกนี้ คุณจะได้เรียนรู้วิธีใช้โค้ดหรือฟังก์ชันที่ทำซ้ำได้กับชุดข้อมูล Python เพื่อสร้างเอาต์พุตประเภทเดียวกัน ซึ่งจะช่วยให้คุณมีประสิทธิภาพมากขึ้นและออกแรงน้อยลงในการดึงข้อมูลบางอย่างจากชุดข้อมูลต่างๆ ในบทช่วยสอนนี้ เราจะใช้โค้ดที่มีอยู่ซึ่งฉันได้สร้างไว้เป็นตัวอย่าง

คุณจะได้เรียนรู้วิธีการทำสำเนาชุดข้อมูลเพื่อหลีกเลี่ยงความเสียหายของชุดข้อมูลเวอร์ชันดั้งเดิม นำเข้าไลบรารีและฟังก์ชันโดยใช้โค้ดที่ทำซ้ำได้ และสร้างการแสดงภาพใน LuckyTemplates

สำหรับบล็อกนี้ ฉันแนะนำให้คุณรับ ไฟล์ CSVตลอดเวลาและนำไปยัง LuckyTemplates ฉันจะสาธิตวิธีที่เราสามารถนำไฟล์ CSV นี้และวางลงใน LuckyTemplates โดยตรง ในกรณีที่คุณต้องทำ

สารบัญ

การดึงไฟล์ CSV ใน LuckyTemplates

ในการนำไฟล์ CSV ไปยัง LuckyTemplates สิ่งแรกที่คุณต้องทำคือคลิกที่เมนู " รับข้อมูล " ในริบบิ้นหน้าแรก

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

หลังจากคลิกแล้ว เมนูแบบเลื่อนลงจะปรากฏขึ้นและคุณต้องเลือกตัวเลือก " ข้อความ/CSV " จากเมนู

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

เมื่อคุณเลือกตัวเลือก “ Text/CSV ” หน้าต่างจะเปิดขึ้นซึ่งเราสามารถเลือกไฟล์ที่เราต้องการนำเข้า LuckyTemplates สำหรับตัวอย่างนี้ ลองใช้ไฟล์  ชุดข้อมูล IMDB

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

เมื่อเปิด ไฟล์ IMDB Dataset.csvคุณจะเห็นอีกหน้าต่างหนึ่งที่แสดงข้อมูลภายในไฟล์นั้น เนื่องจากไฟล์นี้มีข้อมูลจำนวนมาก จึงแสดงตัวอย่างข้อมูลเพียงบางส่วนเท่านั้น

สิ่งแรกที่เราจะทำในไฟล์นี้คือการแปลงไฟล์ ในการทำเช่นนั้น เพียงคลิกที่ตัวเลือก " แปลงข้อมูล " ที่ด้านล่างขวาของหน้าต่าง

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

การทำสำเนาของชุดข้อมูล Python

ก่อนที่เราจะทำการเปลี่ยนแปลงใดๆ กับชุดข้อมูลนี้ สิ่งสำคัญคือต้องทำสำเนาชุดข้อมูลต้นฉบับ ในการทำเช่นนี้ เพียงคลิกขวาที่ชุดข้อมูล 

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

จากนั้นจากเมนู ให้เลือก “ คัดลอก

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

สุดท้ายคลิกขวาที่ แผง Queryจากนั้นเลือก “ Paste ” จากตัวเลือก

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

หลังจากใช้ขั้นตอนเหล่านี้แล้ว คุณควรมีสำเนาของชุดข้อมูล IMDB ดั้งเดิม ในแผ���การสืบค้น

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

การแปลงชุดข้อมูลด้วยการเรียกใช้สคริปต์ Python

การแปลงไฟล์ CSV จะทำให้คุณสามารถแบ่งชุดข้อมูล Python จำนวนมากออกเป็นชุดย่อยๆ ได้ เราสามารถทำได้โดยใช้สคริปต์ Python ในไฟล์นี้

แต่ก่อนอื่น เราต้องแน่ใจว่าส่วนหัวเรียงกันอย่างถูกต้อง คลิกที่ เมนู หน้าแรกแล้วมองหาตัวเลือก " ใช้แถวแรกเป็นส่วนหัว " แล้วคลิก

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

หลังจากคลิกตัวเลือก “ ใช้แถวแรกเป็นส่วนหัว ” ส่วนหัวจะเปลี่ยนเป็นข้อมูลจากแถวแรกก่อนหน้า ซึ่งก็คือ “ รีวิว ” และ “ ความคิดเห็น

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

จากนั้นไปที่ เมนู Transformและคลิกที่ตัวเลือก “ Run Python Script ในกลุ่มตัวเลือก “ Scripts ”

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

หลังจากนั้นหน้าต่าง “ Run Python Script ” จะปรากฏขึ้น ในหน้าต่างนี้ คุณสามารถเรียกใช้สคริปต์ Python ที่คุณต้องการเพื่อแปลงไฟล์ปัจจุบันที่คุณกำลังใช้ สำหรับตัวอย่างนี้ ฉันจะทำให้ชุดข้อมูลมีขนาดเล็กลงโดยการรันโค้ดต่อไปนี้

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

ฉันใช้ ฟังก์ชัน .ilocบนชุดข้อมูลเพื่อเลือกแถวและคอลัมน์เฉพาะจากชุดข้อมูล IMDB จากนั้น ในพารามิเตอร์ ฉันเลือก500 แถว แรก และคอลัมน์ทั้งหมดในชุดข้อมูล IMDB ฉันเก็บไว้ในตัวแปรชื่อ " ชุดข้อมูล "

หลังจากเรียกใช้สคริปต์ เราควรเห็น “ชุดข้อมูล” ซึ่งเป็นตัวแปรที่เราสร้างไว้ในขั้นตอนที่แล้ว ประกอบด้วยข้อมูลที่เราแก้ไขโดยใช้สคริปต์ Python

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

การตรวจสอบชุดข้อมูล

หากต้องการเปิดตารางชุดข้อมูลเพียงคลิกที่ " ตาราง " ใต้คอลัมน์ค่า

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

เราจะเห็นว่า ชุดข้อมูลนี้ลดลงเหลือ500 แถว

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

ตอนนี้เราได้แบ่ง ชุดข้อมูล Pythonออกเป็น 500 แถวแล้ว สิ่งต่อไปที่เราจะทำคือนำเข้าไลบรารีที่เราต้องการ เราจะดำเนินการดังกล่าวโดยใช้ขั้นตอนเดียวกับที่เราทำในการแก้ไขเนื้อหาของชุดข้อมูล IMDB เพื่อให้แน่ใจว่าโค้ดของเราสามารถจัดการได้ในบางสถานการณ์โดยมีการเปลี่ยนแปลงน้อยลง

การนำเข้าไลบรารีและฟังก์ชันโดยใช้รหัสที่ทำซ้ำได้

หากต้องการนำเข้าไลบรารี ให้กลับไปที่สมุดบันทึกของเราและคัดลอกไลบรารีที่เราต้องการ โปรดทราบว่าก่อนหน้าบทช่วยสอนนี้ ฉันได้สร้างคลังเหล่านี้ไว้แล้วซึ่งเรากำลังจะคัดลอก ฉันแค่ใช้สิ่งเหล่านี้ซ้ำเพื่อให้คุณเข้าใจอย่างชัดเจนเกี่ยวกับการใช้ฟังก์ชันเป็นรหัสที่ทำซ้ำได้

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

เมื่อคัดลอกไลบรารีแล้ว ให้วางลงในหน้าต่าง “ Run Python Script ” และอย่าลืมใส่บรรทัด “ from collections import Counter ” ที่ท้ายสคริปต์ 

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

จากนั้นเราจะคัดลอกฟังก์ชันการล้างข้อมูลจากสมุดบันทึกของเรา และเพิ่มลงใน สคริปต์ Pythonใน LuckyTemplates

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

เราจะเพิ่มไว้ใต้ไลบรารี 

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

เราจะคัดลอกโค้ดสำหรับเรียกใช้ฟังก์ชันที่เราเพิ่งเพิ่มเข้าไปด้วย

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

จากนั้นวางลงในสคริปต์ Python ใน LuckyTemplates

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

การสร้างตารางข้อมูล

ตอนนี้เราได้เพิ่มโค้ดสำหรับการเรียกใช้ ฟังก์ชัน ล้างข้อมูลแล้ว เราต้องเปลี่ยน " df2 " เป็น " ชุดข้อมูล " และ " ชื่อเรื่อง " เป็น " ทบทวน " เราทำสิ่งนี้เนื่องจากการเปลี่ยนแปลงที่เราทำในชุดข้อมูล

เราเปลี่ยน “df2” เป็น “ ชุดข้อมูล ” เนื่องจากเราเก็บข้อมูลไว้ 500 แถวใน “ชุดข้อมูล” จากนั้นสำหรับ "ชื่อเรื่อง" เราได้อัปเดตเป็น "บทวิจารณ์" อันเป็นผลจากการเปลี่ยนส่วนหัวของคอลัมน์

เมื่อเพิ่มโค้ดเหล่านี้แล้ว เราควรจะสามารถสร้างหรือสร้างตารางได้ 3 ตาราง ได้แก่data1สำหรับความถี่ของคำdata2สำหรับความถี่ของ bigram และdata3สำหรับความถี่ของ trigram

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

คุณยังสามารถทำสำเนาชุดข้อมูล IMDB ที่แก้ไขแล้ว (2) อีกชุดหนึ่ง เพื่อเปิดตารางอื่นในภายหลัง

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

ตอนนี้ในชุดข้อมูล IMDB (2)มาเปิดdata1 tableกัน 

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

 เมื่อ เปิด ตาราง data1เราจะเห็นรายการคำและความถี่

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

อย่างที่คุณเห็น เราสามารถดำเนินขั้นตอนบางอย่างจากชุดข้อมูลหลักได้โดยใช้รหัสที่ทำซ้ำได้ซึ่งเรานำมาจาก Jupyter Notebook ด้วยรหัสที่ทำซ้ำได้เหล่านี้ เราสามารถแปลงชุดข้อมูล Python และสร้างตารางสำหรับความถี่ของคำ ความถี่ของบิ๊กแกรม และความถี่ของไตรแกรม โดยไม่ต้องพิมพ์รหัสซ้ำ ทั้งหมด

ในชุดข้อมูล IMDB (3)ให้เปิดตาราง data2เพื่อดูความถี่ขนาดใหญ่

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้

ในตารางความถี่ขนาดใหญ่ คุณจะเห็น " br " รวมอยู่ในรายการ นี่อาจเชื่อมต่อกับโค้ด HTML เราสามารถย้อนกลับและเพิ่มสิ่งอื่นได้ แต่เราจะไม่ทำเช่นนั้นในบทช่วยสอนนี้

ตอนนี้ข้อมูลถูกโหลดด้วยความช่วยเหลือของรหัสที่ทำซ้ำได้ เราสามารถเริ่มสร้างภาพข้อมูลใน LuckyTemplates ตัวอย่างเช่นกราฟแท่งสำหรับความถี่ของแต่ละคำ 

ชุดข้อมูล Python: การใช้รหัสที่ทำซ้ำได้


Python ผู้ใช้กำหนดฟังก์ชั่น | รายการ Python ภาพรวม
และสำหรับลูปใน LuckyTemplates
โดยใช้ Python ใน LuckyTemplates | ชุดข้อมูลและฟังก์ชันสตริง

บทสรุป

โดยสรุป โค้ดที่ทำซ้ำได้สามารถช่วยคุณดำเนินการตามขั้นตอนบางอย่างในชุดข้อมูลได้โดยใช้ความพยายามน้อยลง คุณได้เรียนรู้วิธีใช้โค้ดที่ทำซ้ำได้เพื่อแปลงชุดข้อมูล Python ใน LuckyTemplates คุณยังสามารถใช้ฟังก์ชัน.iloc เพื่อระบุแถวและคอลัมน์ที่จะเลือกในการแก้ไขชุดข้อมูล

นอกจากนี้ คุณได้สร้างสำเนาของชุดข้อมูลและสร้างการแสดงภาพโดยใช้กราฟแท่ง การสร้างภาพข้อมูลนี้ขึ้นอยู่กับชุดข้อมูล Python ที่เราสร้างและแก้ไขด้วยความช่วยเหลือของโค้ดที่ทำซ้ำได้

สิ่งที่ดีที่สุด

เกลลิม


ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

วิธีบันทึกและโหลดไฟล์ RDS ใน R

วิธีบันทึกและโหลดไฟล์ RDS ใน R

คุณจะได้เรียนรู้วิธีการบันทึกและโหลดวัตถุจากไฟล์ .rds ใน R บล็อกนี้จะครอบคลุมถึงวิธีการนำเข้าวัตถุจาก R ไปยัง LuckyTemplates

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

ในบทช่วยสอนภาษาการเข้ารหัส DAX นี้ เรียนรู้วิธีใช้ฟังก์ชัน GENERATE และวิธีเปลี่ยนชื่อหน่วยวัดแบบไดนามิก

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

บทช่วยสอนนี้จะครอบคลุมถึงวิธีการใช้เทคนิค Multi Threaded Dynamic Visuals เพื่อสร้างข้อมูลเชิงลึกจากการแสดงข้อมูลแบบไดนามิกในรายงานของคุณ

บทนำในการกรองบริบทใน LuckyTemplates

บทนำในการกรองบริบทใน LuckyTemplates

ในบทความนี้ ฉันจะเรียกใช้ผ่านบริบทตัวกรอง บริบทตัวกรองเป็นหนึ่งในหัวข้อหลักที่ผู้ใช้ LuckyTemplates ควรเรียนรู้ในขั้นต้น

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

ฉันต้องการแสดงให้เห็นว่าบริการออนไลน์ของ LuckyTemplates Apps สามารถช่วยในการจัดการรายงานและข้อมูลเชิงลึกต่างๆ ที่สร้างจากแหล่งข้อมูลต่างๆ ได้อย่างไร

วิเคราะห์การเปลี่ยนแปลงอัตรากำไรล่วงเวลา – การวิเคราะห์ด้วย LuckyTemplates และ DAX

วิเคราะห์การเปลี่ยนแปลงอัตรากำไรล่วงเวลา – การวิเคราะห์ด้วย LuckyTemplates และ DAX

เรียนรู้วิธีคำนวณการเปลี่ยนแปลงอัตรากำไรของคุณโดยใช้เทคนิคต่างๆ เช่น การแยกสาขาและการรวมสูตร DAX ใน LuckyTemplates

แนวคิด Materialization สำหรับแคชข้อมูลใน DAX Studio

แนวคิด Materialization สำหรับแคชข้อมูลใน DAX Studio

บทช่วยสอนนี้จะหารือเกี่ยวกับแนวคิดของการทำให้แคชข้อมูลเป็นรูปธรรมและวิธีที่สิ่งเหล่านี้ส่งผลต่อประสิทธิภาพของ DAX ในการให้ผลลัพธ์

การรายงานทางธุรกิจโดยใช้ LuckyTemplates

การรายงานทางธุรกิจโดยใช้ LuckyTemplates

หากคุณยังคงใช้ Excel อยู่จนถึงตอนนี้ นี่เป็นเวลาที่ดีที่สุดในการเริ่มใช้ LuckyTemplates สำหรับความต้องการในการรายงานทางธุรกิจของคุณ

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้