Pandas의 시계열 데이터

이 자습서에서는 Pandas를 사용하여 시계열 데이터를 리샘플링하는 방법을 배웁니다 . 이 블로그 하단에서 이 튜토리얼의 전체 비디오를 볼 수 있습니다 .

이 리샘플링 아이디어는 무엇입니까? 이것은 시계열 데이터와 관련이 있으며 우리가 할 일은 해당 데이터가 보고되는 빈도를 변경하는 것입니다. 예를 들어 연간 값을 월별 또는 주별로 변경하거나 시간별 데이터를 일별로 변경합니다. 즉, 계층 구조의 수준을 변경하는 것입니다.

이것은 보다 신뢰할 수 있는 추세 , 샘플 크기계절성을 얻는 것과 같은 여러 가지 이유로 사용될 수 있습니다 . 일부 보고서에서는 특정 수준의 계층 구조를 다른 수준과 비교하여 사용하는 것이 더 적합할 것입니다.

또한 데이터 원본이 다르고 시계열 데이터 조인을 수행해야 하는 경우 리샘플링이 도움이 될 수 있습니다. 이는 계층 구조 의 불일치를 처리할 때도 도움이 됩니다 .

Pandas의 시계열 데이터

이를 더 세분화하기 위해 다운샘플링과 업샘플링이 있습니다.

다운샘플링은 보고 빈도를 줄이는 것입니다 . 더 적은 값을 갖기 위해 1초에서 1시간으로 변환하거나 월 단위로 다운샘플링하는 것과 같은 것일 수 있습니다.

반면 업샘플링은 월 수준에서 일 단위로 보고 빈도를 높이는 것입니다 . 나중에 이것에 대한 더 많은 예를 보게 될 것입니다.

Pandas의 시계열 데이터

목차

Pandas를 사용하여 시계열 데이터를 리샘플링하는 방법

Pandas에서 이것을 어떻게 할 것입니까?

먼저 인덱스를 시계열 데이터 열로 변경합니다 . 그런 다음 값을 채우는 보간법을 사용하여 업샘플링하고 값을 집계하여 롤업하기 위해 다운샘플링할 수 있습니다.

Pandas의 시계열 데이터

Jupyter Notebook Python으로 이동하여 Pandas로 확인해 보겠습니다.

우선 import pandas as pd 를 입력하고 import seaborn as sns를 입력 하여 Pandas를 사용하여 시각화하고 import matplotlib.pyplot as plt를 사용 하여 Seaborn 시각화를 사용자 정의합니다 .

다음으로 할 일은 vega_datasets import data 에서 데이터를 가져오는 것입니다 . 샘플 소스를 얻을 수 있는 좋은 장소입니다. 또한 sp = data.sp500( )sp.head( ) 라이브러리를 얻을 것입니다 .

Pandas의 시계열 데이터

지금까지의 데이터입니다. 매일 매일의 수익과 가격이 있습니다.

Pandas의 시계열 데이터

인덱스를 날짜 열로 설정하려면 sp.set_index(['date'], inplace=True)를 입력한 다음 sp.head를 다시 호출합니다.

Pandas의 시계열 데이터

업샘플링을 사용하여 값 얻기

그런 다음 더 많은 값을 가지려면 업샘플링을 사용합시다. 매일 데이터가 있으므로 가장 간단한 함수인 sp [['price']]를 사용하여 시간 단위까지 내려갈 수 있습니다. resample ('H').ffill ( ) , 실행합니다. H 는 시간, M 은 월, D 는 일 등을 나타냅니다. 이에 대한 자세한 내용은 Pandas 문서 에서 확인할 수 있습니다 .

보시다시피 1월 1일 자정 가격은 1394.46이며, 이후 오전 1시부터 오전 4시까지의 시간과 동일합니다. 또 다른 예는 종가가 1366.42인 1월 2일입니다.

Pandas의 시계열 데이터

시간 수준에서 값을 사용할 수 없는 경우에도 이를 수행하는 다른 방법이 있습니다. 또한 정방향 채우기를 수행하는 것보다 더 정교한 방법이 있습니다 . 예를 들어, 우리가 한 것은 업샘플링 보간을 수행하는 기본적인 방법입니다.

다음으로 avg_month = sp [['price]].resample ('M').mean ( ) 을 입력한 다음 avg_month.head ( ) 를 입력하고 실행하여 확인하여 다운샘플링으로 이동합니다.

그림과 같이 매월 말일과 평균 가격을 볼 수 있습니다. 더 적은 값을 갖도록 샘플을 줄일 수 있습니다. 이를 다운사이징이라고 합니다.

Pandas의 시계열 데이터

이를 시각화하기 위해 그려진 치수를 다시 플로팅해 보겠습니다. 그런 다음 sns.lineplot . 선 그래프는 X축이 길수록 더 잘 작동하고 Y 값은 월 평균 가격입니다.

표시된 달의 평균 가격을 보려면 이것을 실행해 봅시다.

Pandas의 시계열 데이터

다시 말하지만, 우리가 이것을 할 수 있는 많은 다른 방법들이 있습니다. 예를 들어 분기별 최저 가격을 알고 싶다면 quarter_low 를 입력한 다음 quarter_low.head 를 입력하여 실행하면 됩니다.

이제 각 분기에서 찾은 분기별 최저 값을 볼 수 있습니다. 이것이 리샘플링을 수행하는 방법입니다.

Pandas의 시계열 데이터


보간법을 사용하여 Python에서 누락된 데이터 처리
Pandas의 MultiIndex for Multi-level 또는 Hierarchical Data
Datasets In Pandas With ProfileReport | LuckyTemplates의 파이썬

결론

결론적으로 Pandas는 실제로 리샘플링 및 시계열 데이터용으로 제작되었습니다 . 시계열 데이터로 작업 중이고 세분성이 다른 경우 리샘플링이 매우 유용할 수 있습니다.

또한 resample 방법에 대한 Pandas 설명서를 읽고 이를 수행하는 다양한 방법을 배우십시오. 기본 사항을 살펴보았지만 격주, 해당 월의 마지막 근무일, 리샘플링을 위한 더 많은 옵션 등을 수행할 수 있습니다.

모두 제일 좋다,

조지 마운트

Leave a Comment

SharePoint의 계산된 열 | 개요

SharePoint의 계산된 열 | 개요

SharePoint에서 계산된 열의 중요성과 목록에서 자동 계산 및 데이터 수집을 수행하는 방법을 알아보세요.

Power Apps에서 변수 만들기: 컬렉션 작업

Power Apps에서 변수 만들기: 컬렉션 작업

컬렉션 변수를 사용하여 Power Apps에서 변수 만드는 방법 및 유용한 팁에 대해 알아보세요.

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거가 수행할 수 있는 작업과 Microsoft Power Automate의 예를 사용하여 이를 사용하는 방법을 알아보고 이해하십시오!

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름 및 용도에 대해 자세히 알아보세요. 다양한 작업 및 시나리오에 사용할 수 있는 다양한 유형의 흐름에 대해 설명합니다.

흐름에서 Power Automate 종료 작업 제어

흐름에서 Power Automate 종료 작업 제어

조건이 충족되지 않는 경우 흐름에서 작업을 종료하는 Power Automate 종료 작업 컨트롤을 올바르게 사용하는 방법을 알아봅니다.

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 실행 기능에 대해 자세히 알아보고 자신의 앱에서 바로 웹사이트, 전화, 이메일 및 기타 앱과 같은 기타 서비스를 실행하십시오.

Power Automate의 HTTP 요청 – 소개

Power Automate의 HTTP 요청 – 소개

타사 애플리케이션 통합과 관련하여 Power Automate의 HTTP 요청이 작동하는 방식을 배우고 이해합니다.

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop에서 Send Mouse Click을 사용하는 방법을 알아보고 이것이 어떤 이점을 제공하고 흐름 성능을 개선하는지 알아보십시오.

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수의 작동 방식, 다양한 종류, 각 변수가 앱에 기여할 수 있는 사항을 알아보세요.

Power Automate에서 실행할 데스크톱 흐름 예약

Power Automate에서 실행할 데스크톱 흐름 예약

이 자습서에서는 Power Automate를 사용하여 웹 또는 데스크톱에서 작업을 자동화하는 방법을 알려줍니다. 데스크톱 흐름 예약에 대한 포괄적인 가이드를 제공합니다.