จะย่อย dataframe ด้วยคอลัมน์เดียวหรือหลายคอลัมน์ได้อย่างไร

เมื่อพยายามทำความเข้าใจ DataFrame ขนาดใหญ่ใน Pandas คุณอาจต้องแบ่งย่อยตามคอลัมน์และแถว ในบทช่วยสอนนี้ เราจะแสดงกรณีการใช้งานที่แพร่หลายที่สุดของการแบ่งพาร์ติชัน DataFrame ของคุณ

เราจะเริ่มต้นด้วยการตั้งค่าตัวอย่าง DataFrame ซึ่งเราจะทำโดยเรียกใช้โค้ด Python ต่อไปนี้ในสภาพแวดล้อมที่เราโปรดปราน (เพื่อความง่าย ฉันใช้ Anaconda และ Jupyter Lab)

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

ตอนนี้ ให้เราดูใน Dataframe แถวแรกโดยใช้เมธอด head()

languages.head()

อย่างที่คุณเห็น นี่เป็น DataFrame ที่ค่อนข้างเรียบง่ายที่เราจะใช้เป็นตัวอย่างในโพสต์นี้:

  ภาษา avg_difficulty_level avg_salary แอปพลิเคชั่น
0 Python 3 120 10
1 ซี-ชาร์ป 2 100 15
2 Javascript 2 120 14
3 PHP 1 80 20

การกรองคอลัมน์เดียว

เราจะเริ่มด้วยกรณีที่ง่ายที่สุด ซึ่งก็คือการย่อยหนึ่งคอลัมน์ออกจากชุดข้อมูลของเรา การรันคำสั่งต่อไปนี้จะสร้างอ็อบเจกต์ Series:

ตามชื่อ/ป้าย

languages["language"]

เอาต์พุตเป็น Series:

0 Python
1 ซี-ชาร์ป
2 Javascript
3 PHP
ชื่อ: ภาษา dtype: object
type(languages["language"])

pandas.core.series.Series

By ดัชนี

คำสั่งต่อไปนี้จะส่งคืน Series ที่มีคอลัมน์แรก

languages.iloc[:,0]

การเลือกหลายคอลัมน์

โดยชื่อ

เมื่อส่งรายการคอลัมน์ Pandas จะส่งคืน DataFrame ที่มีข้อมูลบางส่วน

languages[["language", "applications"]]
  ภาษา แอปพลิเคชั่น
0 Python 10
1 ซี-ชาร์ป 15
2 Javascript 14
3 PHP 20

ตามป้ายกำกับ (พร้อม loc)

df.loc[:,["language","applications"]]

ผลลัพธ์จะคล้ายกัน

By ดัชนี

ทีนี้ลองดึงข้อมูลหลายคอลัมน์โดยใช้ดัชนี:

languages.iloc[: ,[0,3]]
  ภาษา แอปพลิเคชั่น
0 Python 10
1 ซี-ชาร์ป 15
2 Javascript 14
3 PHP 20

ตามเงื่อนไข

ในกรณีนี้ เราจะแสดงเฉพาะคอลัมน์ที่ชื่อตรงกับนิพจน์เฉพาะ เราจะใช้วิธีการ กรองที่ค่อนข้างสะดวก:

languages.filter(axis = 1, like="avg")

หมายเหตุ:

  1. เรายังสามารถกรองตามนิพจน์ทั่วไปเฉพาะ (regex)
  2. เราสามารถใช้พารามิเตอร์ axis=0 เพื่อกรองตามค่าแถวเฉพาะ

กรองแถวเฉพาะตามเงื่อนไข

นี่เป็นวิธีที่ค่อนข้างตรงไปตรงมาในการย่อย DataFrame ตามค่าแถว:

languages[(languages["applications"] > 15)]

เรามีผลลัพธ์เดียวเท่านั้น:

languages[(languages["applications"] > 15)]
  ภาษา avg_difficulty_level avg_salary แอปพลิเคชั่น
3 PHP 1 80 20

ขิง 2.7.53.0

ขิง 2.7.53.0

Ginger เป็นตัวตรวจสอบการสะกดและไวยากรณ์ฟรี

บล็อก

บล็อก

Blocks เป็นเกมทางปัญญาสำหรับนักเรียนชั้นประถมศึกษาปีที่ 3 เพื่อฝึกฝนทักษะการตรวจจับและการมองเห็น และรวมอยู่ในโปรแกรมสนับสนุนการสอนด้านไอทีโดยครู

พรีซี่ 6.26

พรีซี่ 6.26

Prezi เป็นแอปพลิเคชั่นฟรีที่ให้คุณสร้างงานนำเสนอดิจิทัลทั้งออนไลน์และออฟไลน์

แมทเวย์

แมทเวย์

Mathway เป็นแอปที่มีประโยชน์มาก ๆ ที่สามารถช่วยคุณแก้ปัญหาทางคณิตศาสตร์ที่ต้องใช้เครื่องมือที่ซับซ้อนมากกว่าเครื่องคิดเลขในอุปกรณ์ของคุณ

อะโดบี พรีเซนเตอร์

อะโดบี พรีเซนเตอร์

Adobe Presenter เป็นซอฟต์แวร์อีเลิร์นนิงที่เผยแพร่โดย Adobe Systems บนแพลตฟอร์ม Microsoft Windows ในรูปแบบปลั๊กอิน Microsoft PowerPoint

ทูแคน 2.3.0

ทูแคน 2.3.0

Toucan เป็นแพลตฟอร์มเทคโนโลยีการศึกษา ช่วยให้คุณเรียนรู้ภาษาใหม่ในขณะที่ท่องเว็บไซต์ทั่วไปในชีวิตประจำวัน

ENetViet 24.2

ENetViet 24.2

eNetViet เป็นแอปพลิเคชั่นที่ช่วยเชื่อมโยงผู้ปกครองกับโรงเรียนที่บุตรหลานกำลังศึกษาอยู่ เพื่อให้พวกเขาสามารถเข้าใจสถานการณ์การเรียนรู้ในปัจจุบันของบุตรหลานได้อย่างชัดเจน

การพิมพ์อย่างรวดเร็ว

การพิมพ์อย่างรวดเร็ว

RapidTyping เป็นเครื่องมือฝึกแป้นพิมพ์ที่สะดวกและใช้งานง่าย ซึ่งจะช่วยให้คุณปรับปรุงความเร็วในการพิมพ์และลดข้อผิดพลาดในการสะกดคำ ด้วยบทเรียนที่จัดไว้สำหรับหลายระดับ RapidTyping จะสอนวิธีพิมพ์หรือพัฒนาทักษะที่มีอยู่

ประเภทคณิตศาสตร์ 7.4.10.53

ประเภทคณิตศาสตร์ 7.4.10.53

MathType เป็นซอฟต์แวร์สมการเชิงโต้ตอบจากนักพัฒนา Design Science (Dessci) ซึ่งช่วยให้คุณสร้างและใส่คำอธิบายประกอบทางคณิตศาสตร์สำหรับการประมวลผลคำ การนำเสนอ eLearning ฯลฯ ตัวแก้ไขนี้ยังใช้ในการสร้างเอกสาร TeX, LaTeX และ MathML อีกด้วย

ไวยากรณ์

ไวยากรณ์

แอปที่ขับเคลื่อนด้วย AI ของ Grammarly ช่วยให้ผู้คนสื่อสารได้อย่างมีประสิทธิภาพมากขึ้น ผู้ใช้หลายล้านคนพึ่งพา Grammarly ทุกวันเพื่อทำให้ข้อความ เอกสาร และโพสต์บนโซเชียลมีเดียมีความชัดเจน ปราศจากข้อผิดพลาด และเป็นมืออาชีพมากขึ้น