ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
ในบล็อกของวันนี้ เราจะแนะนำกระบวนการแสดงภาพ ความสัมพันธ์ของ Pythonและวิธีการนำเข้าภาพเหล่านี้ไปยัง LuckyTemplates คุณสามารถดูวิดีโอทั้งหมดของบทช่วยสอนนี้ได้ที่ด้านล่างของบล็อกนี้
สารบัญ
ทำความเข้าใจเกี่ยวกับความสัมพันธ์
นี่เป็นภาพที่ดีที่แสดงความสัมพันธ์ประเภทต่างๆ
เริ่มจากด้านซ้าย เรามีความสัมพันธ์เชิงบวกที่สมบูรณ์แบบซึ่งหมายความว่ามันมีค่าสหสัมพันธ์เท่ากับ 1 จากนั้นจึงตามด้วยความสัมพันธ์เชิงบวกโดยเรียงลำดับจากมากไปหาน้อยซึ่งนำไปสู่ 0
กราฟกลางแสดงความสัมพันธ์ที่ไม่มีค่าความสัมพันธ์เท่ากับ 0
สุดท้าย ด้านขวามือแสดงค่าความสัมพันธ์เชิงลบที่ลดลงจาก 0 กราฟด้านขวาสุดคือความสัมพันธ์เชิงลบที่สมบูรณ์แบบซึ่งมีค่าสหสัมพันธ์เท่ากับ -1
แพ็คเกจสำหรับ Python Correlation
เราจะใช้สี่แพ็คเกจสำหรับบทช่วยสอนนี้ แพ็คเกจแรกของเราคือPandasเพื่อใช้สำหรับจัดการข้อมูลและบันทึกเป็นตัวแปร pd
สำหรับการแสดงภาพ เราจะใช้Matplotlibซึ่งบันทึกเป็น ตัวแปร pltเพื่อให้ใช้ฟังก์ชันเหล่านี้ได้ง่ายขึ้น Seaborn ไลบรารีการสร้าง ภาพสถิติของเราจะถูกบันทึกเป็นsns และสุดท้ายNumpyที่จะบันทึกเป็นnpจะใช้สำหรับพีชคณิตเชิงเส้น
สำหรับข้อมูล เราจะใช้ชุดข้อมูลตัวอย่างใน Seaborn จากนั้นใช้ตัวแปร sns เราจะนำ ชุดข้อมูล เพชรมาแสดงด้านล่าง .
แอตทริบิวต์ของข้อมูล
เราสามารถดูแอตทริบิวต์ของข้อมูลของเราได้โดยใช้ฟังก์ชันdataset.info ฟังก์ชันนี้แสดงให้เราเห็นประเภทข้อมูลที่แตกต่างกันทั้งหมดดังที่เห็นในคอลัมน์สุดท้ายด้านล่าง
โปรดทราบว่าความสัมพันธ์จะใช้ได้กับตัวแปรที่เป็นตัวเลขเท่านั้น ดังนั้น เราจะดูที่ตัวแปรที่เป็นตัวเลขเป็นส่วนใหญ่ อย่างไรก็ตาม เราจะได้เรียนรู้วิธีใช้ตัวแปรตามหมวดหมู่สำหรับการแสดงภาพด้วย
ชุดข้อมูลความสัมพันธ์ของ Python
ด้วยการใช้ function head ที่เขียนเป็นdataset.headเราจะได้ข้อมูล 5 แถวบนสุดซึ่งควรมีลักษณะดังนี้
เรามีกะรัตในคอลัมน์แรก ตามด้วยตัวแปรตามหมวดหมู่cut , color , and Clarity , และค่าตัวเลขสำหรับข้อมูลที่เหลือ
Python Correlation: การสร้างแผนภาพกระจาย
เมื่อแสดงภาพความ สัมพันธ์ และดูที่ตัวแปรสองตัว เรามักจะดูที่แผนภาพกระจาย
ดังนั้น การใช้ไลบรารี Seaborn เราจึงสร้างแผนภาพกระจายโดยใช้ฟังก์ชันแผนภาพกระจายที่เราส่งผ่านข้อมูลที่เราบันทึกไว้ด้านบนเป็นdata =dataset จากนั้น เราระบุตัวแปร X และ Y— กะรัตและราคาตามลำดับ
นี่คือโครงเรื่องกระจายของเราที่สร้างจากห้องสมุด Seaborn
คุณจะเห็นได้ว่า Scatter Plot นี้ค่อนข้างหนาแน่น นั่นเป็นเพราะเรามีข้อมูลประมาณ 54,000 แถว และจุดต่างๆ ไม่จำเป็นต้องแสดงด้วยวิธีที่ดีที่สุด
เราสามารถกดแป้น Shift + Tab เพื่อดูวิธีต่างๆ ในการจัดรูปแบบพล็อตกระจาย มันจะแสดงรายการพารามิเตอร์ต่าง ๆ ที่เราสามารถเพิ่มลงในพล็อตกระจายของเรา
การเลื่อนลงมาจะทำให้เราทราบข้อมูลว่าพารามิเตอร์แต่ละรายการทำหน้าที่อะไร
พารามิเตอร์พล็อตกระจายเพิ่มเติม
มาดำน้ำกันสักหน่อย เราสามารถทำให้linewidth=0ได้ เพราะเส้นสีขาวในแผนภาพกระจายอันแรกของเรา ดังที่แสดงด้านล่าง ค่อนข้างคลุมเครือ
นอกจากนี้เรายังต้องการปรับอัลฟาเพื่อให้เราสามารถควบคุมความทึบได้ ลองใช้alpha=0.2สำหรับตัวอย่างของเรา แต่แน่นอนว่าคุณสามารถเปลี่ยนเป็น 0.1 ได้เช่นกัน
หากเราเพิ่มพารามิเตอร์เหล่านี้และคลิกที่Runคุณจะเห็นว่าแผนการกระจายของเรามีความทึบมากขึ้นโดยไม่มีเส้นสีขาว
คุณสามารถเล่นกับพารามิเตอร์ต่างๆ เพื่อให้ได้ภาพที่ดีที่สุดที่คุณกำลังมองหา
การใช้ตัวแปรหมวดหมู่
เรายังสามารถใช้ตัวแปรตามหมวดหมู่เพื่อปรับปรุงภาพของเราได้อีกด้วย ตัวอย่างเช่น เรารู้ว่าข้อมูลของเรามีการเจียระไนสำหรับเพชรของเรา
สิ่งที่เราทำได้คือส่งผ่านหมวดหมู่การตัดนั้นโดยใช้ พารามิเตอร์ hueเป็นhue='cut' ซึ่งจะทำให้เราเห็นภาพจุดเหล่านี้ได้โดยการเปลี่ยนสี
แน่นอน เราสามารถเพิ่มพารามิเตอร์อื่นๆ เช่น อัลฟ่า เป็นต้น เราสามารถเพิ่มอีกครั้ง ตั้งค่าเป็น 0.2 และดูว่าการเปลี่ยนแปลงนั้นเป็นอย่างไร ลองคลิกRunแล้วคุณจะเห็นความแตกต่างเล็กน้อย
เราสามารถเล่นกับพารามิเตอร์เพื่อให้ได้ภาพที่เราต้องการ นอกจากนี้ เรายังสามารถใช้หมวดหมู่ต่างๆ เช่น ความชัดเจน ซึ่งให้หมวดหมู่ความชัดเจนแก่เรา และยังให้มุมมองที่แตกต่างกันเล็กน้อยของการกระจายนั้น
ความสัมพันธ์กับตัวแปรอื่น ๆ
คุณอาจสนใจว่าค่าอื่นๆ มีความสัมพันธ์กันอย่างไรนอกเหนือจากราคาและกะรัต ดังนั้น หากเราดูแผนการกระจายสำหรับตารางซึ่งเป็นมิติตัวเลขของเพชรและ ความลึกเราจะเห็นว่าไม่มีความสัมพันธ์เชิงเส้นแบบหนึ่งต่อหนึ่ง
เรายังสามารถดูตัวแปรอื่นๆ อีกสอง ตัวแปรเช่นความลึกและราคา จากกราฟเราจะเห็นว่าศูนย์ข้อมูลอยู่รอบ ๆ พื้นที่ตรงกลาง
Python Correlation: การสร้างแผนภาพการถดถอย
มาดูสิ่งที่เราเรียกว่าแผนภาพถดถอยที่ช่วยให้เราสามารถประเมินความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัวได้
ดังนั้นแทนที่จะใช้ฟังก์ชัน scatter plot เราจะใช้ ฟังก์ชัน regplotในครั้งนี้ เราจะส่งผ่านโครงสร้างเดียวกัน—ข้อมูลของเรา จากนั้นตัวแปร X และ Y
ผลลัพธ์จะแสดงเส้นที่วัดความสัมพันธ์เชิงเส้นระหว่างตัวแปร นอกจากนี้ยังเห็นได้ชัดว่าค่านิยมของเราวนรอบเส้นถดถอยนั้นอย่างไร
นี่ไม่ใช่ภาพที่สวยงามมากในขณะนี้ แต่เรายังสามารถเพิ่มประสิทธิภาพเพื่อให้ได้ภาพที่ดียิ่งขึ้น ตัวอย่างเช่น เราสามารถส่งผ่านสไตล์โดยใช้ตัวแปร Matplotlib เราสามารถเปลี่ยนสไตล์เป็นพื้นหลังสีเข้มได้โดยใช้โค้ดplt.style.use('dark_background')
ใช้โครงร่างการถดถอยแบบเดียวกันนั้นและส่งคำหลักบางคำสำหรับการกระจายและบรรทัดของเรา ลองใช้สีแดงและความกว้างของเส้น 1 สำหรับเส้นถดถอยของเรา line_kws ={“color” : “red”, 'linewidth' : 1).
สำหรับคีย์เวิร์ดกระจาย ให้ตั้งค่าสีเป็นสีขาว สีขอบเป็นสีเทา และความทึบเป็น 0.4 เพื่อเขียนเป็นscatter_kws={“color” : “white”, 'edgecolor' : 'grey', 'alpha' : 0.4 ).
พารามิเตอร์เหล่านี้ให้มุมมองที่แตกต่างกันเล็กน้อยที่แสดงด้านล่าง
Python Correlation: การสร้างเมทริกซ์สหสัมพันธ์
จนถึงตอนนี้ สิ่งที่เรากำลังดูคือแผนการกระจายที่มีตัวแปรเพียงสองตัว แต่เราอาจต้องการดูความสัมพันธ์ของตัวแปรทั้งหมดของเราด้วย
สิ่งนี้ดำเนินการโดยใช้ชุดข้อมูลของเราที่มีฟังก์ชัน data frame ที่เรียกว่า correlation ซึ่งแสดงเป็นdataset.corr และสิ่งที่เราจะได้คือเมทริกซ์ที่แสดงความสัมพันธ์ของตัวแปรเหล่านี้แต่ละตัว
ตัวเลขในตารางด้านบนแสดงถึงความสัมพันธ์ของเพียร์สันซึ่งมุ่งเน้นไปที่ความสัมพันธ์เชิงเส้นระหว่างตัวแปรเหล่านี้ทั้งหมด
แต่ถ้าเราไม่แน่ใจว่าตัวแปรของเรามีความสัมพันธ์เชิงเส้นทั้งหมดหรือไม่ เราสามารถใช้ความสัมพันธ์ประเภทอื่นซึ่งเน้นที่ผลกระทบมากกว่าส่วนที่เป็นเส้นตรง เรียกว่าความสัมพันธ์แบบสเปียร์แมน
และเราสามารถดูข้อมูลเกี่ยวกับสิ่งเหล่านี้ได้โดยการกด Shift + Tab หากคุณเลื่อนลงมา เราจะเห็นความสัมพันธ์ของอันดับสเปียร์แมน ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน และวิธีการวัดข้อมูลของเราด้วยวิธีต่างๆ มากมาย
เมื่อมองย้อนกลับไปที่เมทริกซ์สหสัมพันธ์ก่อนหน้านี้ เรารู้ว่าราคาและกะรัตมีความสัมพันธ์กันค่อนข้างดี
พวกมันมาจากพล็อตของเราตรงนี้ แสดงว่าพวกมันค่อนข้างเป็นเส้นตรงที่ 0.92
ตอนนี้ถ้าเราใช้ความสัมพันธ์ของ Spearman แทน ผลกระทบหรืออันดับจะสูงขึ้นเล็กน้อยที่ 0.96
ความสัมพันธ์ประเภทต่างๆ เหล่านี้ทำให้เราสามารถเลือกคุณลักษณะต่างๆ ของความสัมพันธ์ระหว่างตัวแปรเหล่านั้นได้
ความสัมพันธ์หลายตัวแปร x ตัวแปรเดียว
บางครั้ง เราไม่ต้องการเห็นเมทริกซ์เพราะเรากังวลมากกว่าเกี่ยวกับความสัมพันธ์ของตัวแปรทั้งหมดที่มีตัวแปรเดียว (เช่น ราคา)
สิ่ง ที่เราทำได้คือแยกราคาโดยใช้dataset.corrตามด้วย'price'
ตอนนี้ เราจะเห็นว่าราคามีความสัมพันธ์กับตัวแปรตัวเลขต่างๆ ทั้งหมดในตารางนี้ และเหตุผลที่เราอาจต้องการทำเช่นนี้ก็เพื่อแปลงภาพ
มาดูการแสดงภาพเมทริกซ์สหสัมพันธ์ของเราด้วยแผนที่ความร้อน
Python Correlation: การสร้างแผนที่ความร้อน
เราสามารถส่งตัวแปรความสัมพันธ์นี้ไปยังแผนที่ความร้อน ของ Seaborn โดยใช้ฟังก์ชันsns.heatmap
นี่จะทำให้เรามีแผนที่ความร้อนที่มีลักษณะเช่นนี้
อีกครั้ง เราสามารถเพิ่มพารามิเตอร์ตามความต้องการของเรา เราสามารถส่งผ่านพารามิเตอร์linewidths=1และเพิ่มคำอธิบายประกอบโดยใช้annot= True
และคุณจะเห็นว่าแผนที่ความร้อนของเราตอนนี้ดูแตกต่างออกไปมาก ตอนนี้เรามีแผนที่ความร้อนที่ค่อนข้างดี
เราสามารถเห็นประโยชน์ของการเพิ่มบรรทัดและคำอธิบายประกอบ อีกครั้งหากเรากด Shift + Tab พารามิเตอร์ต่าง ๆ ทั้งหมดที่สามารถเข้าไปได้จะปรากฏขึ้น
ต่อไป ให้ลองเพิ่มmethod='spearman ' ในโค้ดของเรา เพื่อที่คุณจะได้ทราบวิธีการใช้ความสัมพันธ์ประเภทต่างๆ โดยขึ้นอยู่กับกรณีการใช้งานของคุณ
แผนที่ความร้อนด้วยตัวแปรเดียว
ต่อไป เราจะแยกตัวแปรหนึ่งตัวและสร้างแผนที่ความร้อนที่มีความสัมพันธ์ที่เปลี่ยนจากลบเป็นบวก
นี่จะให้แผนที่ความร้อนแก่เราด้านล่าง
เราสามารถเปลี่ยนสไตล์ได้เช่นกัน ตัวอย่างเช่น เราสามารถใช้ พารามิเตอร์ cmapเป็นcmap='coolwarm ' สิ่งนี้จะเปลี่ยนสีเป็นเย็นและอบอุ่น และจะกำจัดพื้นหลังสีดำของเราด้วย
ถ้าเราคลิกRunเราจะได้แผนที่ความร้อนด้านล่าง สำหรับความเย็น เรามีสีน้ำเงิน และสำหรับความอบอุ่น เรามีแถบสีแดง
เรายังสามารถเปลี่ยนทิศทางเพื่อให้แผนที่ของเราตรงกับแถบสีได้อีกด้วย ซึ่งทำได้โดยแก้ไข พารามิเตอร์ sort_values และเพิ่มascending= False
สิ่งนี้จะเปลี่ยนจากความสัมพันธ์ที่สัมพันธ์กันมากที่สุด (แถบสีแดง) ไปยังความสัมพันธ์ที่น้อยที่สุด (แถบสีน้ำเงิน)
Python Correlation: การสร้าง Staircase Visual
วิธีขั้นสูงวิธีหนึ่งในการทำให้เห็นภาพความสัมพันธ์ของคือการใช้มาสก์เพื่อบล็อกความสัมพันธ์ทั้งหมดที่เราได้ทำไปแล้ว
เราสามารถทำได้ด้วย Numpy โดยใช้ฟังก์ชัน TRUE และ FALSE เพื่อสร้างภาพขั้นบันไดสำหรับความสัมพันธ์ของเรา
ผลลัพธ์ควรมีลักษณะดังนี้
มาดูกันว่าเราจะไพพ์สิ่งนี้ไปยัง LuckyTemplates ได้อย่างไร
ภาพบันไดใน LuckyTemplates
ก่อนอื่น เปิด LuckyTemplates ฉันได้นำชุดข้อมูลอะโวคาโดเข้ามาเพื่อให้เราเห็นภาพที่แตกต่างกัน คุณสามารถดูชุดข้อมูลนี้ได้ภายใต้บานหน้าต่างเขตข้อมูล เริ่มต้น วิชวล Pythonโดยคลิกที่ไอคอน Pythonใต้บานหน้าต่างการแสดงภาพ
เราจำเป็นต้องสร้างชุดข้อมูลโดยเพิ่มตัวแปรตัวเลขทั้งหมดที่ระบุด้วยเครื่องหมาย? . เพิ่มโดยคลิกช่องทำเครื่องหมายข้างตัวแปรเหล่านี้
ตอนนี้เรามีชุดข้อมูลแล้ว เราสามารถไปที่สมุดบันทึก Jupyter และคัดลอกรหัสนี้ที่เรามีก่อนหน้านี้
จากนั้น เราจะคัดลอกโค้ดไปยังตัวแก้ไขสคริปต์ Python ใน LuckyTemplates
ต่อไป เราจะเลือกวิชวลของเรา ซึ่งจะเป็นวิชวลบันได เราจะกลับไปที่ Jupyter คัดลอกโค้ดที่เราใช้สำหรับภาพบันไดของเรา
วางโค้ดลงในโปรแกรมแก้ไขสคริปต์ Python
สิ่งสุดท้ายที่ต้องทำคือตรวจสอบให้แน่ใจว่าเราใช้plt.showซึ่งจำเป็นในสคริปต์ Python ของคุณ เพิ่มplt.showในบรรทัดสุดท้ายของโค้ด และคลิกไอคอนเรียกใช้ที่มุมขวาบนของโปรแกรมแก้ไขสคริปต์
หากต้องการภาพที่ใหญ่ขึ้น ให้ยืดกรอบออกเล็กน้อยเพื่อให้เรามองเห็นสคริปต์ทำงานในมุม เรามีวิชวลสำหรับแผนที่ความร้อนของเรา ซึ่งดูดีทีเดียว
และใน LuckyTemplates เราสามารถเห็นได้อย่างชัดเจนว่าภาพนั้นอาจเปลี่ยนแปลงอย่างไรตามชุดข้อมูล ตัวอย่างเช่น เราสามารถคลิก ไอคอน ตัวแบ่งส่วนข้อมูลในบานหน้าต่างการแสดงภาพและไปที่พิมพ์ในบานหน้าต่างเขตข้อมูล
มันจะให้ข้อมูลสองประเภทแก่เราในชุดข้อมูลของเรา แบบทั่วไปและแบบทั่วไป ถ้าเราคลิกประเภทหนึ่ง เช่นอินทรีย์คุณจะเห็นว่าแผนที่ความร้อนเปลี่ยนไป
การเปลี่ยนแปลงจะมีผลเมื่อเราคลิกที่ ประเภท ทั่วไปถัดไป
โปรดจำไว้ว่าเราต้องมีตัวแปรที่เป็นหมวดหมู่ในชุดข้อมูลของ สคริปต์ Pythonเพื่อให้ตัวกรองเหล่านี้ทำงานได้ อย่างที่เราเห็น ชุดข้อมูลที่เราสร้างขึ้นมีประเภททำให้เราสามารถกรองภาพในลักษณะนั้นได้
สร้างความสัมพันธ์แบบจำลองข้อมูลของคุณใน
การวิเคราะห์ข้อความ LuckyTemplates ใน Python | การเขียนสคริปต์ Python บทนำ
ในรายงานข้อมูล LuckyTemplates
บทสรุป
ในบล็อกนี้ คุณได้เ��ียนรู้วิธีแสดงภาพความสัมพันธ์ใน Python และ LuckyTemplates โดยใช้วิธีการต่างๆ เช่น ความสัมพันธ์แบบ Pearson และความสัมพันธ์อันดับ Spearman
ตอนนี้ คุณสามารถสร้างแผนภูมิกระจาย แผนภูมิการถดถอย เมทริกซ์สหสัมพันธ์ แผนที่ความร้อน และภาพแบบขั้นบันไดเพื่อให้ได้ภาพที่ดีที่สุดสำหรับชุดข้อมูลของคุณ คุณยังสามารถใช้พารามิเตอร์ต่างๆ เพื่อปรับปรุงสไตล์และวิชวล
สิ่งที่ดีที่สุด
ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
คุณจะได้เรียนรู้วิธีการบันทึกและโหลดวัตถุจากไฟล์ .rds ใน R บล็อกนี้จะครอบคลุมถึงวิธีการนำเข้าวัตถุจาก R ไปยัง LuckyTemplates
ในบทช่วยสอนภาษาการเข้ารหัส DAX นี้ เรียนรู้วิธีใช้ฟังก์ชัน GENERATE และวิธีเปลี่ยนชื่อหน่วยวัดแบบไดนามิก
บทช่วยสอนนี้จะครอบคลุมถึงวิธีการใช้เทคนิค Multi Threaded Dynamic Visuals เพื่อสร้างข้อมูลเชิงลึกจากการแสดงข้อมูลแบบไดนามิกในรายงานของคุณ
ในบทความนี้ ฉันจะเรียกใช้ผ่านบริบทตัวกรอง บริบทตัวกรองเป็นหนึ่งในหัวข้อหลักที่ผู้ใช้ LuckyTemplates ควรเรียนรู้ในขั้นต้น
ฉันต้องการแสดงให้เห็นว่าบริการออนไลน์ของ LuckyTemplates Apps สามารถช่วยในการจัดการรายงานและข้อมูลเชิงลึกต่างๆ ที่สร้างจากแหล่งข้อมูลต่างๆ ได้อย่างไร
เรียนรู้วิธีคำนวณการเปลี่ยนแปลงอัตรากำไรของคุณโดยใช้เทคนิคต่างๆ เช่น การแยกสาขาและการรวมสูตร DAX ใน LuckyTemplates
บทช่วยสอนนี้จะหารือเกี่ยวกับแนวคิดของการทำให้แคชข้อมูลเป็นรูปธรรมและวิธีที่สิ่งเหล่านี้ส่งผลต่อประสิทธิภาพของ DAX ในการให้ผลลัพธ์
หากคุณยังคงใช้ Excel อยู่จนถึงตอนนี้ นี่เป็นเวลาที่ดีที่สุดในการเริ่มใช้ LuckyTemplates สำหรับความต้องการในการรายงานทางธุรกิจของคุณ
เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้