วิธีโหลดชุดข้อมูลตัวอย่างใน Python

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

ในโพสต์นี้ เราจะดูวิธีการโหลดชุดข้อมูลตัวอย่างใน Python นี่อาจไม่ใช่หัวข้อที่น่าดึงดูดใจที่สุด แต่จริงๆแล้วมันค่อนข้างสำคัญ ตามหลักการแล้ว คุณจะมีชุดข้อมูลบางชุดใน Python ที่คุณสามารถฝึกฝนได้เมื่อคุณเรียนรู้แนวคิดใหม่ คุณสามารถดูวิดีโอทั้งหมดของบทช่วยสอนนี้ได้ที่ด้านล่างของบล็อกนี้

หากคุณกำลังจะแบ่งปันโค้ดบันทึกสิ่งที่คุณได้ทำลงไปหรือต้องการความช่วยเหลือเป็นความคิดที่ดีจริงๆ ที่จะใช้ชุดข้อมูลที่มีอยู่ทั่วไปเพื่อสร้างสิ่งที่เรียกว่าตัวอย่างที่ทำซ้ำได้น้อยที่สุด

คุณจะมีโค้ดหรือสคริปต์ที่รวมไว้ล่วงหน้าซึ่งคนอื่นบนอินเทอร์เน็ตสามารถเรียกใช้และช่วยคุณได้ หากคุณไม่สร้างตัวอย่างที่ทำซ้ำได้น้อยที่สุด เหล่านี้ คุณจะถูกจุดไฟในตำแหน่งเช่น Stack Overflow ซึ่งอาจทำให้ตกใจเล็กน้อยหากคุณไม่คุ้นเคย

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

มาดูวิธีสร้างตัวอย่างที่ทำซ้ำได้น้อยที่สุดและรับชุดข้อมูล มีแพ็คเกจไม่กี่ชุดที่คุณสามารถใช้เพื่อโหลดชุดข้อมูลที่สร้างไว้ล่วงหน้าลงใน Python และแบ่งปันโค้ดนั้น

เราจะดูสามแพ็คเกจที่เป็นแพ็คเกจที่พบบ่อยที่สุด มาเริ่มสร้างโน้ตบุ๊ก Jupyter เปล่าและเริ่มกันเลย

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

สารบัญ

โหลดชุดข้อมูลใน Python จาก Sklearn

อันแรกที่เราจะดูเรียกว่าSklearn หากคุณใช้ Anaconda คุณไม่จำเป็นต้องดาวน์โหลดสิ่งนี้ หากคุณต้องการความช่วยเหลือเพิ่มเติมเกี่ยวกับ Python LuckyTemplates มีที่คุณสามารถลงทะเบียนได้

ฉันจะสมมติว่าคุณรู้เกี่ยวกับสิ่งต่าง ๆ เช่นแพ็คเกจแล้วและไปจากที่นั่น เราจะนำแพนด้าและ Sklearn เข้ามา โดยเฉพาะโมดูลย่อยของชุดข้อมูล

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

เราจะนำชุดข้อมูลเหล่านี้มาบางส่วน Scikit-learn – คลังข้อมูลแมชชีนเลิร์นนิง – เรียกมันว่าชุดข้อมูลของเล่น เราจะโหลด Boston ซึ่งเป็นชุดข้อมูลราคาที่อยู่อาศัย เมื่อนำสิ่งนี้เข้ามาเราต้องมีไว้เป็น data frame

เราจำเป็นต้องระบุว่าข้อมูลและคอลัมน์มาจากชุดข้อมูล Scikit-learn และแยกตัวแปรคุณลักษณะและตัวแปรเป้าหมาย

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

เราจะเอาสิ่งนี้มาเป็น data frame เพื่อให้เราดำเนินการและทำสิ่งต่างๆ กับมันได้ Panda เป็นแพ็คเกจที่ยอดเยี่ยมสำหรับการรู้จักในฐานะผู้ใช้ LuckyTemplates

โหลดชุดข้อมูลใน Python จากชุดข้อมูล Vega

ตัวเลือกอื่นที่เราสามารถเรียนรู้ได้คือแพ็คเกจชุดข้อมูล Vega อันนี้ไม่มีใน Anaconda แต่เราสามารถติดตั้งผ่าน PIP นี่คือสิ่งที่เราจะพิมพ์บนบรรทัดคำสั่งเพื่อติดตั้งชุดข้อมูล Vega และติดตั้งหรือนำเข้าโมดูลข้อมูลในเครื่อง

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

คุณสามารถรับสิ่งเหล่านี้ได้ แต่คุณจะต้องเชื่อมต่อกับเว็บ เราจะนำเข้าข้อมูลที่ติดตั้งในเครื่องโดยนำเข้าข้อมูลในเครื่องและเรียกใช้งาน

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

อย่างที่คุณเห็น มีชุดข้อมูลค่อนข้างน้อย บางส่วนเป็นอนุกรมเวลา ในขณะที่บางส่วนมีตัวแปรตามหมวดหมู่หรือต่อเนื่อง ลองเลือกชุดข้อมูลรถยนต์ใน data frame เพื่อให้เราสามารถเรียกใช้เมธอดหลักได้

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

ตอนนี้เรามีชุดข้อมูลตัวอย่างอีกชุดที่เราสามารถใช้และแบ่งปันได้

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

โหลดชุดข้อมูลใน Python จาก Seaborn

Seaborn เป็นอีกหนึ่งแพ็คเกจที่มีอยู่ในการจัดจำหน่าย Anaconda ตามค่าเริ่มต้น Seaborn เป็นที่รู้จักกันดีที่สุดในด้านการแสดงข้อมูล แต่ก็มีชุดข้อมูลตัวอย่างที่ยอดเยี่ยมที่คุณสามารถใช้ได้ นี่คือสิ่งที่เราจะพิมพ์เพื่อรับชุดข้อมูล

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

อย่างที่คุณเห็น มีชุดข้อมูลค่อนข้างน้อยที่นี่ เราจะใช้ชุดข้อมูลเพนกวินและรับแถวแรกอีกครั้ง

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

ผลลัพธ์คือชุดข้อมูลอื่นสำหรับเราในการฝึกปฏิบัติ

วิธีโหลดชุดข้อมูลตัวอย่างใน Python

แนวคิดนี้ไม่ใช่แค่การมีชุดข้อมูลเพื่อฝึกฝนเท่านั้น หากเราเห็นค่าบางอย่างขาดหายไป มีปัญหาในการทิ้งชุดข้อมูล ต้องการเติมตัวแปรตามหมวดหมู่หรือแสดงตัวอย่างให้ผู้อื่นเห็นโดยไม่ให้ข้อมูลที่ละเอียดอ่อน คุณสามารถใช้ชุดข้อมูลที่สาธารณะเข้าถึงได้ชุดใดชุดหนึ่งซึ่งง่ายมากจริงๆ เพื่อให้ผู้คนนำไปใช้และแบ่งปัน นั่นคือแนวคิดของตัวอย่างที่ทำซ้ำได้น้อยที่สุด

LuckyTemplates ด้วยการเขียนสคริปต์ Python เพื่อสร้างตารางวันที่
Python ใน LuckyTemplates: วิธีติดตั้งและตั้งค่า
Python I สำหรับผู้ใช้ LuckyTemplates – หลักสูตรใหม่ในแพลตฟอร์มการศึกษา LuckyTemplates

บทสรุป

สรุปแล้ว มีสถานที่สามแห่งในการค้นหาชุดข้อมูลตัวอย่าง Scikit-learnเป็นชุดการเรียนรู้ของเครื่อง การแปลงยากขึ้นเล็กน้อย แต่ถ้าคุณกำลังทำสิ่งต่างๆ ที่เกี่ยวข้องกับแมชชีนเลิร์นนิง นี่คือที่ที่ควรไป ชุดข้อมูล Vegaยังมีชุดข้อมูลค่อนข้างดีโดยเฉพาะถ้าคุณใช้วิธีรับชุดข้อมูลจากเว็บ แต่โหลดค่อนข้างยาก ดังนั้นคุณต้องใช้ PIP แทนที่จะติดตั้ง Anaconda ไว้ล่วงหน้า Seabornเป็นจุดที่น่าสนใจเพราะโหลดเฟรมข้อมูลและมีความสามารถรอบด้านมากมายเมื่อต้องใช้ชุดข้อมูลตัวอย่างและตัวอย่างที่ทำซ้ำได้

Stack Overflow ยังมีบทช่วยสอนเกี่ยวกับวิธีการเขียนตัวอย่างที่ทำซ้ำได้น้อยที่สุดหรือ MRE ที่ดีอีกด้วย ดังนั้นโปรดตรวจสอบว่าคุณต้องการโพสต์บางสิ่งทางออนไลน์หรือไม่

การรู้ว่าจะรับชุดข้อมูลที่ดีและแบ่งปัน MRE ที่ดีได้จากที่ใดเป็นทักษะที่สำคัญอย่างยิ่งที่ต้องมีในฐานะนักวิเคราะห์

หากคุณชอบเนื้อหาที่ครอบคลุมในบทช่วยสอนนี้ โปรดสมัครรับข้อมูลจากช่อง LuckyTemplates TV เรามีเนื้อหาจำนวนมากออกมาตลอดเวลาจากตัวฉันเองและผู้สร้างเนื้อหาจำนวนมาก – ทั้งหมดนี้ทุ่มเทให้กับการปรับปรุงวิธีที่คุณใช้ LuckyTemplates และ Power Platform


ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง

วิธีบันทึกและโหลดไฟล์ RDS ใน R

วิธีบันทึกและโหลดไฟล์ RDS ใน R

คุณจะได้เรียนรู้วิธีการบันทึกและโหลดวัตถุจากไฟล์ .rds ใน R บล็อกนี้จะครอบคลุมถึงวิธีการนำเข้าวัตถุจาก R ไปยัง LuckyTemplates

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

เยี่ยมชม N วันทำการแรก – โซลูชันภาษาการเข้ารหัส DAX

ในบทช่วยสอนภาษาการเข้ารหัส DAX นี้ เรียนรู้วิธีใช้ฟังก์ชัน GENERATE และวิธีเปลี่ยนชื่อหน่วยวัดแบบไดนามิก

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

แสดงข้อมูลเชิงลึกโดยใช้เทคนิคการแสดงภาพแบบไดนามิกแบบหลายเธรดใน LuckyTemplates

บทช่วยสอนนี้จะครอบคลุมถึงวิธีการใช้เทคนิค Multi Threaded Dynamic Visuals เพื่อสร้างข้อมูลเชิงลึกจากการแสดงข้อมูลแบบไดนามิกในรายงานของคุณ

บทนำในการกรองบริบทใน LuckyTemplates

บทนำในการกรองบริบทใน LuckyTemplates

ในบทความนี้ ฉันจะเรียกใช้ผ่านบริบทตัวกรอง บริบทตัวกรองเป็นหนึ่งในหัวข้อหลักที่ผู้ใช้ LuckyTemplates ควรเรียนรู้ในขั้นต้น

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

เคล็ดลับที่ดีที่สุดในการใช้แอปใน LuckyTemplates Online Service

ฉันต้องการแสดงให้เห็นว่าบริการออนไลน์ของ LuckyTemplates Apps สามารถช่วยในการจัดการรายงานและข้อมูลเชิงลึกต่างๆ ที่สร้างจากแหล่งข้อมูลต่างๆ ได้อย่างไร

วิเคราะห์การเปลี่ยนแปลงอัตรากำไรล่วงเวลา – การวิเคราะห์ด้วย LuckyTemplates และ DAX

วิเคราะห์การเปลี่ยนแปลงอัตรากำไรล่วงเวลา – การวิเคราะห์ด้วย LuckyTemplates และ DAX

เรียนรู้วิธีคำนวณการเปลี่ยนแปลงอัตรากำไรของคุณโดยใช้เทคนิคต่างๆ เช่น การแยกสาขาและการรวมสูตร DAX ใน LuckyTemplates

แนวคิด Materialization สำหรับแคชข้อมูลใน DAX Studio

แนวคิด Materialization สำหรับแคชข้อมูลใน DAX Studio

บทช่วยสอนนี้จะหารือเกี่ยวกับแนวคิดของการทำให้แคชข้อมูลเป็นรูปธรรมและวิธีที่สิ่งเหล่านี้ส่งผลต่อประสิทธิภาพของ DAX ในการให้ผลลัพธ์

การรายงานทางธุรกิจโดยใช้ LuckyTemplates

การรายงานทางธุรกิจโดยใช้ LuckyTemplates

หากคุณยังคงใช้ Excel อยู่จนถึงตอนนี้ นี่เป็นเวลาที่ดีที่สุดในการเริ่มใช้ LuckyTemplates สำหรับความต้องการในการรายงานทางธุรกิจของคุณ

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้

เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้