ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
ในบทช่วยสอนนี้ ฉันจะสาธิตวิธีเปลี่ยนข้อมูลที่ซ้อนกันยุ่งเหยิงให้เป็นรูปแบบที่เป็นระเบียบมากขึ้น มีวิธีที่ค่อนข้างง่ายในการทำเช่นนี้ และเป็นวิธีที่จะมีประโยชน์อย่างเหลือเชื่อและมีแอปพลิเคชันต่างๆ มากมาย เรากำลังจะใช้โมดูล Power Query คุณสามารถดูวิดีโอทั้งหมดของบทช่วยสอนนี้ได้ที่ด้านล่างของบล็อกนี้
ภรรยาของผมลงมาที่สำนักงานและบอกว่าเธอได้คัดลอกที่อยู่จำนวนมากจากคำเชิญในปฏิทิน และจบลงด้วยการวางในรูปแบบนี้ เธอมีที่อยู่อีเมลและชื่อ 28 รายการที่ลงท้ายด้วยรูปแบบเรียงซ้อนแปลกๆ แบบนี้ เป็นรายชื่อที่มีเครื่องหมายอัญประกาศ เครื่องหมายจุลภาค ขยะ และที่อยู่อีเมล เธอต้องการทราบวิธีการใช้ Power Query เพื่อให้อยู่ในรูปแบบที่ดีขึ้น
ลองข้ามไปที่ Power Query แล้วเราจะเห็นข้อมูลดิบ มาเก็บข้อมูลดิบไว้และอ้างอิงกัน เราจะเรียกไฟล์อ้างอิงนี้ว่าTestData
สิ่งแรกที่เราจะทำคือเพิ่มดัชนี และไม่สำคัญสำหรับวัตถุประสงค์เหล่านี้ ไม่ว่าจะเป็นดัชนีแบบศูนย์หรือดัชนีแบบฐานเดียว เราจะใช้ดัชนีฐานศูนย์สำหรับการสาธิตนี้ คลิกง่ายโดยไม่ต้องผ่านตัวเลือกอื่น
สิ่งนี้จะเกี่ยวข้องกับเดือยเพราะเดือยรับแถวและเปลี่ยนเป็นคอลัมน์ ในกรณีนี้ เราต้องการใช้แถวชุดนี้และเปลี่ยนเป็นสามคอลัมน์ แถวหนึ่งสำหรับชื่อ แถวหนึ่งสำหรับนามสกุล และอีกแถวหนึ่งสำหรับที่อยู่อีเมล
เรากำลังจะเปลี่ยน Pivot ในคอลัมน์ แต่เราต้องมีวิธีให้ Pivot รู้ว่าองค์ประกอบใดไปอยู่ในคอลัมน์ใด นี่คือที่มาของ Power Query Modulo
สารบัญ
การจัดการข้อมูลซ้อนโดยใช้ Power Query Modulo
โมดูโล่ให้ส่วนที่เหลือแก่เราเมื่อเราหารจำนวนเฉพาะ ในการเข้าถึง Modulo เราไปที่แถบ Add Column จากนั้นเราจะพบ Standard คลิกที่ลูกศรแบบหล่นลง แล้วเลื่อนลงมา
เมื่อเราคลิกที่ Modulo จะแสดงกล่องป๊อปอัพที่ถามจำนวนคอลัมน์ที่เราต้องการ ในกรณีนี้เราต้องการสามคอลัมน์
ถ้าเราหารสามด้วยสาม เราจะได้หนึ่งเศษที่เหลือเป็นศูนย์ สามในสี่ให้เศษเหลือหนึ่ง สามในห้าให้เศษเหลือสอง แล้วสามในหกให้เศษศูนย์ ดังนั้น มันจึงสร้างรูปแบบการทำซ้ำที่ดีที่เราสามารถใช้กับเดือยของเราได้
แต่ก่อนที่เราจะทำเช่นนั้น มาล้างข้อมูลกันก่อน มีสองวิธีที่เราสามารถทำได้ หนึ่งคือเราสามารถแทนที่ค่าได้ ตัวอย่างเช่น สำหรับเครื่องหมายคำพูด เราสามารถใส่เครื่องหมายคำพูดในนั้นแล้วแทนที่ด้วยสิ่งใดก็ได้ มันจะใช้และล้างคำพูดเหล่านั้นออก
อีกวิธีในการทำเช่นนี้โดยที่เราทุกคนสามารถล้างข้อมูลและบันทึกบางขั้นตอนได้ใน คราวเดียวคือการใช้ฟังก์ชันที่เรียกว่าText.Remove ขั้นแรก เราเพิ่มคอลัมน์แบบกำหนดเอง จากนั้นจึงแสดงรายการค่าทั้งหมดที่เราต้องการกำจัด
อย่างที่คุณเห็น นั่นเป็นการเคลียร์ทุกอย่างออกไปอย่างสวยงามและง่ายดาย ดังนั้น ตอนนี้เราสามารถกำจัดคอลัมน์เริ่มต้นนั้น แล้วย้ายคอลัมน์แบบกำหนดเองนั้นไป
ตอนนี้เราสามารถทำเดือยของเราได้อย่างหมดจด เราใช้ Modulo ไปที่ Transform จากนั้นไปที่ Pivot Column และเราจะทำ Pivot ใน Custom แต่เราไม่ต้องการให้มันรวมกัน ดังนั้น เราจะเลือก Don't Aggregate และคลิก OK
เราแค่แทนที่ด้วยค่าเหล่านี้ในคอลัมน์ จากนั้นจะสร้างสามคอลัมน์นั้นให้เรา เราสามารถเห็นนามสกุล ชื่อจริง และที่อยู่อีเมลในนั้น แต่มันไม่ใช่รูปแบบที่เราต้องการ
ในการแก้ไขปัญหานี้ เราสามารถใช้คอลัมน์เหล่า นี้แล้วทำการเติม
และตอนนี้เรามีแถวพิเศษเหล่านี้เนื่องจากรูปแบบซ้ำๆ ของ Modulo
เราสามารถกำจัดสิ่งนั้นได้อย่างง่ายดายโดยการลบแถวอื่นออก เราสามารถทำได้ในตัวเลือกลบแถว
เราสามารถพูดได้ว่าแถวแรกที่จะลบคือสอง จากนั้นเอาแถวที่สองและสามออก แล้วเก็บแถวที่สี่ไว้และทำแบบนั้นซ้ำ
ตอนนี้คุณจะเห็นได้ว่าเราได้ล้างข้อมูลที่ถูกต้องทั้งหมดด้วยวิธีที่ดีแล้ว และเรายังคงมีที่อยู่อีเมลเดิม 28 รายการ
ตอนนี้เราสามารถกำจัดคอลัมน์ดัชนีและเปลี่ยนชื่อส่วนหัวของคอลัมน์ได้
LuckyTemplates Modulo และฟังก์ชัน DAX หารจำนวนเต็ม
Power Query Best Practices สำหรับโมเดลข้อมูลของคุณ
Power Query M: การสลับรูปแบบ 0-1 ในตารางวันที่
บทสรุป
คุณจะเห็นได้เพียงแค่ใช้ Modulo Trick จากนั้นทำ Pivot ข้อมูลและทำความสะอาดเล็กน้อย มันค่อนข้างง่ายที่จะทำ เมื่อคุณเริ่มคุ้นเคยแล้ว อาจใช้เวลาประมาณหนึ่งนาทีในการทำทั้งหมด
หวังว่าสิ่งนี้จะให้แนวคิดและเครื่องมือเพิ่มเติมแก่คุณ คุณยังสามารถดูบทช่วยสอน ถัดไปของฉัน ได้ อีกด้วย ในนั้น เราจะพิจารณาเพิ่มเติมเกี่ยวกับบางสิ่งที่เรากล่าวถึงในบทช่วยสอนนี้ และดูวิธีที่เราสามารถทำให้กระบวนการนี้เป็นไปโดยอัตโนมัติด้วยวิธีที่ทำซ้ำได้ โดยใช้ฟังก์ชันแบบกำหนดเอง ฉันจะแสดงเคล็ดลับเจ๋งๆ สำหรับการดีบักฟังก์ชันที่คุณกำหนดเองด้วย
ฉันหวังว่าคุณจะพบว่ามีประโยชน์ คุณสามารถดูวิดีโอแบบเต็มด้านล่างและดูลิงก์ด้านล่างสำหรับเนื้อหาที่เกี่ยวข้องเพิ่มเติม
ดีที่สุด!
ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
คุณจะได้เรียนรู้วิธีการบันทึกและโหลดวัตถุจากไฟล์ .rds ใน R บล็อกนี้จะครอบคลุมถึงวิธีการนำเข้าวัตถุจาก R ไปยัง LuckyTemplates
ในบทช่วยสอนภาษาการเข้ารหัส DAX นี้ เรียนรู้วิธีใช้ฟังก์ชัน GENERATE และวิธีเปลี่ยนชื่อหน่วยวัดแบบไดนามิก
บทช่วยสอนนี้จะครอบคลุมถึงวิธีการใช้เทคนิค Multi Threaded Dynamic Visuals เพื่อสร้างข้อมูลเชิงลึกจากการแสดงข้อมูลแบบไดนามิกในรายงานของคุณ
ในบทความนี้ ฉันจะเรียกใช้ผ่านบริบทตัวกรอง บริบทตัวกรองเป็นหนึ่งในหัวข้อหลักที่ผู้ใช้ LuckyTemplates ควรเรียนรู้ในขั้นต้น
ฉันต้องการแสดงให้เห็นว่าบริการออนไลน์ของ LuckyTemplates Apps สามารถช่วยในการจัดการรายงานและข้อมูลเชิงลึกต่างๆ ที่สร้างจากแหล่งข้อมูลต่างๆ ได้อย่างไร
เรียนรู้วิธีคำนวณการเปลี่ยนแปลงอัตรากำไรของคุณโดยใช้เทคนิคต่างๆ เช่น การแยกสาขาและการรวมสูตร DAX ใน LuckyTemplates
บทช่วยสอนนี้จะหารือเกี่ยวกับแนวคิดของการทำให้แคชข้อมูลเป็นรูปธรรมและวิธีที่สิ่งเหล่านี้ส่งผลต่อประสิทธิภาพของ DAX ในการให้ผลลัพธ์
หากคุณยังคงใช้ Excel อยู่จนถึงตอนนี้ นี่เป็นเวลาที่ดีที่สุดในการเริ่มใช้ LuckyTemplates สำหรับความต้องการในการรายงานทางธุรกิจของคุณ
เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้