ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
การทำงานกับไฟล์ Excel เป็นงานทั่วไปในชีวิตประจำวันของมืออาชีพหลายคน พวกเราบางคนชอบมันและบางคนก็เกลียดมัน อย่างไรก็ตาม Python มีไลบรารีหลายตัวเพื่อทำให้กระบวนการนี้ง่ายขึ้น คล่องตัวขึ้น และมีประสิทธิภาพมากขึ้น
ทั้ง Pandas Library และ openpyxl อนุญาตให้ผู้ใช้เปิดไฟล์ excel ใน Python Pandas มีวิธีการในตัวที่ทำให้มันง่าย ในขณะที่ openpyxl นั้นยอดเยี่ยมเมื่อคุณต้องการการควบคุมโครงสร้างและการจัดรูปแบบของไฟล์มากขึ้น
ในบทความนี้ เราจะสำรวจวิธีการต่างๆ ในการเปิดและทำงานกับสเปรดชีตใน Python โดยใช้ไลบรารีเหล่านี้ ด้วยความรู้นี้ คุณจะสามารถประมวลผลและวิเคราะห์ข้อมูล Excel ได้อย่างมีประสิทธิภาพโดยใช้เครื่องมือที่มีประสิทธิภาพจากระบบนิเวศที่กว้างขวางของ Python!
สารบัญ
ข้อกำหนดเบื้องต้นคืออะไร?
ก่อนที่จะดำดิ่งสู่ขั้นตอนการเปิดไฟล์ Excel ใน Python มีข้อกำหนดเบื้องต้นบางประการที่จำเป็นต้องมี ก่อนอื่น คุณควรมีความเข้าใจพื้นฐานเกี่ยวกับการเขียนโปรแกรม Python รวมถึงตัวแปร ฟังก์ชัน และการนำเข้าไลบรารี
สิ่งนี้จะช่วยให้คุณเข้าใจและทำงานกับตัวอย่างโค้ดที่ให้ไว้ในบทความได้อย่างง่ายดาย
นอกจากความรู้พื้นฐานของ Python แล้ว การติดตั้งไลบรารีที่จำเป็นก็มีความสำคัญเช่นกัน มีไลบรารี Python มากมายสำหรับการทำงานกับไฟล์ Excel รวมถึง:
pandas: ไลบรารีการจัดการข้อมูลที่ทรงพลัง
openpyxl:ไลบรารียอดนิยมสำหรับการอ่านและเขียนไฟล์ Excel
xlrd:ไลบรารีสำหรับอ่านข้อมูลและจัดรูปแบบข้อมูลจากไฟล์ Excel
xlwt: ไลบรารีสำหรับเขียนข้อมูลและจัดรูปแบบข้อมูลเป็นไฟล์ Excel
xlutils:ชุดเครื่องมือสำหรับการทำงานกับสมุดงาน Excel รวมถึงการอ่าน เขียน และแก้ไขข้อมูล
หากต้องการติดตั้งไลบรารีใดๆ ข้างต้นโดยใช้ pip ให้เปิดพรอมต์คำสั่งหรือเทอร์มินัลแล้วพิมพ์คำสั่งต่อไปนี้ แทนที่ ` library_name`ด้วยไลบรารีที่ต้องการ:
pip install
ข้อกำหนดเบื้องต้นที่สำคัญอีกประการหนึ่งคือการมี สเปรดชีต Excelเพื่อใช้งาน คุณควรเตรียมสมุดงาน Excel ที่มีข้อมูลที่คุณต้องการจัดการด้วย Python
คุณสามารถดาวน์โหลดสมุดงานตัวอย่างได้จาก Microsoft และไซต์การสอนอื่นๆ
แม้ว่าไฟล์จะมีหลายชีตและรูปแบบต่างๆ ได้ แต่ขอแนะนำให้เริ่มต้นด้วยชุดข้อมูลง่ายๆ สำหรับกระบวนการเรียนรู้เบื้องต้น คุณสามารถจัดการกับสเปรดชีตที่ซับซ้อนได้เมื่อคุณได้รับประสบการณ์และความเข้าใจเกี่ยวกับไลบรารีที่ใช้งานมากขึ้น
วิธีติดตั้งไลบรารีที่จำเป็น
ในการทำงานกับสเปรดชีต Excel ใน Python คุณต้องติดตั้งไลบรารีที่เหมาะสม มีไลบรารี่มากมายสำหรับจุดประสงค์นี้ แต่สองไลบรารีที่ได้รับความนิยมมากที่สุดคือopenPyXLและxlrd
OpenPyXL เป็นไลบรารี Python ที่อนุญาตให้อ่านและเขียนไฟล์ Excel (โดยเฉพาะไฟล์ xltm, xlsm, xltx และ xlsx) ไม่จำเป็นต้องติดตั้ง Microsoft Excel และใช้งานได้กับทุกแพลตฟอร์ม ในการติดตั้ง OpenPyXL โดยใช้ pip ให้รันคำสั่งต่อไปนี้ในเทอร์มินัลของคุณ:
pip install openpyxl
ในทางกลับกัน xlrd เป็นไลบรารีที่ใช้กันอย่างแพร่หลายสำหรับการอ่านข้อมูลและจัดรูปแบบข้อมูลจากไฟล์ Excel รองรับรูปแบบไฟล์ xls และ xlsx โดยเฉพาะ
ในการติดตั้ง xlrd โดยใช้ pip ให้รันคำสั่งต่อไปนี้ในเทอร์มินัลของคุณ:
pip install xlrd
เมื่อติดตั้งไลบรารีที่ต้องการแล้ว คุณสามารถดำเนินการอ่านหรือเขียนไฟล์ Excel ใน Python ได้ แต่ละไลบรารีมีฟีเจอร์และรูปแบบเฉพาะที่แตกต่างกัน ดังนั้นจึงจำเป็นอย่างยิ่งที่จะต้องเลือกไลบรารีที่เหมาะกับความต้องการของคุณมากที่สุด
2 วิธี วิธีเปิดไฟล์ Excel ใน Python
ในส่วนนี้ เราจะพูดถึงสองวิธีที่ได้รับความนิยมในการเปิดสเปรดชีต Excel เราจะสำรวจว่าคุณสามารถทำได้อย่างไรกับทั้งไลบรารี Pandas และ Openpyxl
1. การใช้หมีแพนด้า
Pandas เป็นไลบรารีการวิเคราะห์ข้อมูลที่มีประสิทธิภาพใน Python ซึ่งมีฟังก์ชันอำนวยความสะดวกในการอ่าน เขียน และจัดการข้อมูลจากรูปแบบต่างๆ รวมถึงรูปแบบไฟล์ Excel และ CSV
คุณสามารถตรวจสอบความสามารถของมันได้ในวิดีโอนี้เกี่ยวกับวิธีการสุ่มตัวอย่างข้อมูลอนุกรมเวลาใหม่โดยใช้ Pandas เพื่อปรับปรุงการวิเคราะห์:
หากต้องการเปิดสเปรดชีต Excel โดยใช้ Pandas ให้ทำตามคำแนะนำด้านล่าง:
ก่อนอื่น ให้ติดตั้งไลบรารี่ของ Pandas หากคุณยังไม่ได้ติดตั้ง คุณสามารถติดตั้งโดยใช้ pip:
pip install pandas
จากนั้นนำเข้า Pandas ในสคริปต์ Python และใช้ฟังก์ชัน read_excel() เพื่อโหลดไฟล์:
#Read excel spreadsheets with pandas
import pandas as pd
file_name = "path/to/your/file.xlsx" # Replace with your file path
sheet = "Sheet1" # Specify the sheet name or number
df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df.head(5)) # Print first 5 rows of the dataframe
สิ่งนี้จะอ่านแผ่นงาน Excel ที่ระบุลงใน Pandas DataFrame ซึ่งสามารถจัดการได้อย่างง่ายดายโดยใช้ฟังก์ชันในตัวต่างๆ
หมายเหตุ:หากคุณไม่ระบุชื่อชีต ไลบรารีแพนด้าจะนำเข้าชีตทั้งหมดและจัดเก็บไว้ในพจนานุกรม คุณสามารถเข้าถึงแผ่นงานเหล่านี้ได้โดยใช้ชื่อแผ่นงานเป็นคีย์
ตัวอย่างเช่น ถ้าคุณต้องการเรียกแผ่นงานชื่อ ' month_report ' คุณสามารถใช้รหัสด้านล่าง:
print(df['monthly_report'])
2. ใช้ openpyxl
Openpyxl เป็นไลบรารี่ยอดนิยมอีกตัวใน Python สำหรับทำงานกับไฟล์ Excel โดยเฉพาะ หากต้องการเปิดสมุดงาน Excel ใน Python โดยใช้ Openpyxl ให้ทำตามคำแนะนำด้านล่าง:
ก่อนอื่นให้ติดตั้ง openpyxl หากคุณยังไม่ได้ติดตั้ง คุณสามารถติดตั้งโดยใช้ pip:
pip install openpyxl
ถัดไป นำเข้า openpyxl ใน Python IDE ของคุณ และใช้ฟังก์ชัน l oad_workbook()เพื่อโหลดสมุดงาน Excel ของคุณ:
from openpyxl import load_workbook file_name = "path/to/your/file.xlsx" # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows(): print([cell.value for cell in row])
การดำเนินการนี้จะโหลดไฟล์ Excel ที่ระบุและให้การเข้าถึงแผ่นงาน แถว และเซลล์แต่ละเซลล์ ช่วยให้คุณทำงานกับข้อมูลได้อย่างง่ายดาย
ทั้ง Pandas และ openpyxl เป็นไลบรารีที่มีประสิทธิภาพซึ่งช่วยให้คุณเปิดและจัดการไฟล์ Excel ใน Python ได้อย่างมีประสิทธิภาพ เลือกแบบที่เหมาะกับความต้องการและความต้องการเฉพาะของคุณมากที่สุด
จะอ่านข้อมูล Excel ใน Python ได้อย่างไร
การอ่านข้อมูล Excel ใน Python สามารถทำได้ง่ายๆ โดยใช้ไลบรารี Pandas ซึ่งมีชุดวิธีการที่มีประสิทธิภาพและใช้งานง่ายสำหรับการทำงานกับข้อมูลแบบตาราง ในส่วนนี้ คุณจะได้เรียนรู้วิธีการอ่านข้อมูล Excel โดยใช้หมีแพนด้า โดยเน้นที่การเข้าถึงชีตเฉพาะและการดึงค่าเซลล์
อ่านแผ่นงานเฉพาะ
หากต้องการอ่านแผ่นงานเฉพาะจากไฟล์ Excel โดยใช้ pandas คุณเพียงแค่ส่งชื่อแผ่นงานหรือดัชนีแผ่นงานเป็นพารามิเตอร์ไปยัง read_excelmethod นี่คือตัวอย่าง:
import pandas as pd
file_name = 'example.xlsx'
sheet = 'Sheet1'
df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)
ข้อมูลโค้ดนี้นำเข้าไลบรารี Pandas และระบุชื่อของสเปรดชีต Excel และแผ่นงานที่จะอ่าน จากนั้นจะอ่านแผ่นงานที่ระบุโดยใช้ เมธอด read_excel()และพิมพ์ DataFrame ที่เป็นผลลัพธ์
หากต้องการนำเข้าหลายแผ่นใน data frame ให้ตั้งค่าพารามิเตอร์ sheet_name ให้เท่ากับ None สิ่งนี้จะนำเข้าแผ่นงานทั้งหมดในสมุดงานไปยัง dataframe ของคุณ
อ่านค่าของเซลล์
เมื่อคุณนำเข้าข้อมูลไปยัง DataFrame แพนด้าเสร็จแล้ว คุณจะสามารถเข้าถึงค่าแต่ละเซลล์โดยใช้เมธอดiat [] ของ DataFrame วิธีการใช้ดัชนีแถวและคอลัมน์เป็นอาร์กิวเมนต์
นี่คือตัวอย่าง:
cell_value = df.iat[1, 2]
print(f'The cell value at row 2, column 3 is: {cell_value}')
ข้อมูลโค้ดนี้จะแยกค่าเซลล์ที่ดัชนีแถว 1 และดัชนีคอลัมน์ 2 (ตรงกับแถวที่สองและคอลัมน์ที่สาม) จาก DataFrame (df) ที่โหลดไว้ก่อนหน้านี้ หลังจากแยกค่าเซลล์แล้ว จะพิมพ์ค่าออกมา
ในส่วนนี้ คุณได้เรียนรู้วิธีการอ่านข้อมูล Excel ใน Python โดยเน้นที่การอ่านชีตเฉพาะและดึงค่าเซลล์โดยใช้ไลบรารีแพนด้า ความรู้นี้จะช่วยให้คุณสามารถทำงานกับข้อมูล Excel ในโครงการ Python ของคุณได้อย่างมีประสิทธิภาพ
วิธีจัดการกับข้อมูล Excel
ในส่วนนี้ เราจะพูดถึงวิธีอัปเดตค่าเซลล์ และเพิ่มหรือลบแถวและคอลัมน์ในไฟล์ Excel โดยใช้ Python สำหรับตัวอย่างเหล่านี้ เราจะใช้ OpenPyXL เนื่องจากมีหลายวิธีที่คุณสามารถใช้เพื่อเปลี่ยนหรือแทรกข้อมูลในสมุดงาน Excel
อัปเดตค่าเซลล์
ในการแก้ไขค่าเซลล์ของ Excel เราจะใช้ไลบรารี openpyXL ถัดไป นำเข้าโมดูลที่จำเป็นและโหลดสมุดงาน Excel:
#Reading excel files with openpyxl
from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')
เลือกแผ่นงาน Excel ที่คุณต้องการจัดการ
sheet = workbook.active
วิธี การ ที่ใช้งานอยู่จะเลือกแผ่นงานแรกในสมุดงาน หากคุณต้องการเลือกแผ่นงานอื่น ให้ใช้รูปแบบสมุดงาน[< ชื่อแผ่นงาน >]
หากต้องการเปลี่ยนค่าเซลล์ เพียงกำหนดค่าใหม่ให้กับเซลล์ที่ต้องการ:
sheet['A1'] = "New Value"
สุดท้าย บันทึกสมุดงานที่แก้ไข:
workbook.save('example_modified.xlsx')
เพิ่มและลบแถวและคอลัมน์
การเพิ่มและลบแถวหรือคอลัมน์สามารถทำได้ง่ายๆ ด้วย OpenPyXL นี่คือวิธี:
เพิ่มแถว:หากต้องการแทรกแถว ให้ใช้ฟังก์ชันinsert_rows() ตัวอย่างต่อไปนี้เพิ่มสองแถวหลังจากแถวแรก:
sheet.insert_rows(2, 2)
ลบแถว:หากต้องการลบแถว ให้ใช้ฟังก์ชันdelete_rows() ตัวอย่างต่อไปนี้จะลบสองแถวโดยเริ่มจากแถวที่ 3:
sheet.delete_rows(3, 2)
เพิ่มคอลัมน์:หากต้องการแทรกคอลัมน์ ให้ใช้ฟังก์ชันinsert_cols() ตัวอย่างต่อไปนี้เพิ่มสองคอลัมน์หลังจากคอลัมน์แรก:
sheet.insert_cols(2, 2)
ลบคอลัมน์:หากต้องการลบคอลัมน์ ให้ใช้ฟังก์ชันdelete_cols() ตัวอย่างต่อไปนี้จะลบสองคอลัมน์โดยเริ่มจากคอลัมน์ 3:
sheet.delete_cols(3, 2)
อย่าลืมบันทึกสมุดงานที่อัปเดต:
workbook.save('example_modified.xlsx')
วิธีบันทึกไฟล์ Excel ใน Python
หากต้องการบันทึกไฟล์ Excel ใน Python คุณสามารถใช้ไลบรารี เช่น Pandas หรือ openpyxl ไลบรารีทั้งสองมีวิธีการเขียนข้อมูลไปยังไฟล์ Excel ที่แตกต่างกัน ในส่วนนี้ เราจะสำรวจแต่ละแนวทางและแสดงตัวอย่างวิธีการบันทึกไฟล์ Excel โดยใช้ Python
การใช้ Pandas: Pandas เป็นไลบรารียอดนิยมสำหรับการจัดการและวิเคราะห์ข้อมูล มีเมธอดในตัวที่เรียกว่าto_excel()ซึ่งช่วยให้คุณบันทึก DataFrame เป็นไฟล์ Excel ได้:
import pandas as pd
# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)
# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)
ในตัวอย่างนี้ เราสร้าง DataFrame ตัวอย่างและบันทึกเป็นไฟล์ Excel ชื่อ “output.xlsx” โดยใช้วิธีto_excel() คุณสามารถดูสเปรดชีตผลลัพธ์ด้านล่าง
การใช้ OpenPyXL: openpyxl เป็นอีกหนึ่งไลบรารีที่มีประสิทธิภาพซึ่งออกแบบมาสำหรับการทำงานกับไฟล์ Microsoft Excel โดยเฉพาะ นี่คือตัวอย่างวิธีการบันทึกข้อมูลลงในไฟล์ Excel โดยใช้ OpenPyXL:
from openpyxl import Workbook
# Creating a new workbook
wb = Workbook()
# Selecting the active worksheet
ws = wb.active
# Adding data to the worksheet
data = [
(1, 'A'),
(2, 'B'),
(3, 'C'),
(25, 'Y'),
(26, 'Z')
]
for row in data:
ws.append(row)
# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')
ในตัวอย่างนี้ เราสร้างสมุดงานใหม่และเพิ่มข้อมูลลงในแผ่นงานที่ใช้งานอยู่โดยใช้วิธีการผนวก () สุดท้าย เราบันทึกสมุดงานเป็นไฟล์ Excel ชื่อ “ output_openpyxl.xlsx “
ทั้ง Pandas และ openpyxl มีฟังก์ชันการทำงานที่มีประสิทธิภาพสำหรับการบันทึกไฟล์ Excel ใน Python ดังนั้น ทางเลือกของคุณขึ้นอยู่กับข้อกำหนดและความซับซ้อนของงานของคุณ
ถึงเวลาสรุปสิ่งต่างๆ
ในบทความนี้ เราได้สำรวจไลบรารีต่างๆ สำหรับการเปิดและทำงานกับไฟล์ Excel ใน Python ไลบรารีเหล่านี้แต่ละไลบรารีมีคุณลักษณะและข้อดีเฉพาะของตัวเอง ช่วยให้คุณสามารถทำงานต่างๆ เช่น การอ่านและเขียนข้อมูล การเข้าถึงชีต และการจัดการค่าของเซลล์
ด้วยการรวมวิธีการที่กล่าวถึงในบทความนี้ คุณจะสามารถทำงานกับไฟล์ Excel ได้อย่างมีประสิทธิภาพ ขยายขีดความสามารถของโครงการของคุณ และเพิ่มพูนทักษะการวิเคราะห์และจัดการข้อมูลของคุณ
เมื่อคุณใช้ไลบรารีเหล่านี้ต่อไปและสำรวจการทำงานของไลบรารีเหล่านี้ คุณจะมีความเชี่ยวชาญมากขึ้นในการจัดการสเปรดชีตด้วย Python บทความนี้ได้จัดเตรียมทักษะที่จำเป็นเพื่อให้งานสำเร็จลุล่วง ได้เวลาทดสอบทักษะใหม่ของคุณแล้ว!
ตนเองคืออะไรใน Python: ตัวอย่างในโลกแห่งความเป็นจริง
คุณจะได้เรียนรู้วิธีการบันทึกและโหลดวัตถุจากไฟล์ .rds ใน R บล็อกนี้จะครอบคลุมถึงวิธีการนำเข้าวัตถุจาก R ไปยัง LuckyTemplates
ในบทช่วยสอนภาษาการเข้ารหัส DAX นี้ เรียนรู้วิธีใช้ฟังก์ชัน GENERATE และวิธีเปลี่ยนชื่อหน่วยวัดแบบไดนามิก
บทช่วยสอนนี้จะครอบคลุมถึงวิธีการใช้เทคนิค Multi Threaded Dynamic Visuals เพื่อสร้างข้อมูลเชิงลึกจากการแสดงข้อมูลแบบไดนามิกในรายงานของคุณ
ในบทความนี้ ฉันจะเรียกใช้ผ่านบริบทตัวกรอง บริบทตัวกรองเป็นหนึ่งในหัวข้อหลักที่ผู้ใช้ LuckyTemplates ควรเรียนรู้ในขั้นต้น
ฉันต้องการแสดงให้เห็นว่าบริการออนไลน์ของ LuckyTemplates Apps สามารถช่วยในการจัดการรายงานและข้อมูลเชิงลึกต่างๆ ที่สร้างจากแหล่งข้อมูลต่างๆ ได้อย่างไร
เรียนรู้วิธีคำนวณการเปลี่ยนแปลงอัตรากำไรของคุณโดยใช้เทคนิคต่างๆ เช่น การแยกสาขาและการรวมสูตร DAX ใน LuckyTemplates
บทช่วยสอนนี้จะหารือเกี่ยวกับแนวคิดของการทำให้แคชข้อมูลเป็นรูปธรรมและวิธีที่สิ่งเหล่านี้ส่งผลต่อประสิทธิภาพของ DAX ในการให้ผลลัพธ์
หากคุณยังคงใช้ Excel อยู่จนถึงตอนนี้ นี่เป็นเวลาที่ดีที่สุดในการเริ่มใช้ LuckyTemplates สำหรับความต้องการในการรายงานทางธุรกิจของคุณ
เกตเวย์ LuckyTemplates คืออะไร ทั้งหมดที่คุณต้องการรู้