변수의 분포를 시각화하는 Python의 Seaborn 함수

여러 변수로 구성된 데이터 세트로 작업할 때 이러한 변수가 서로 어떻게 다르고 상호 작용하는지 이해할 수 있는 것이 가장 좋습니다. 이 튜토리얼에서는 Python에서 Seaborn 함수를 사용하여 변수 분포에 대한 대안을 시각화하는 방법을 보여드리겠습니다. 이 블로그 하단에서 이 튜토리얼의 전체 비디오를 볼 수 있습니다.

목차

Python에서 Seaborn 함수 사용
결론

Python에서 Seaborn 함수 사용

Seaborn 내에서 사용할 수 있는 MPG 데이터 세트에서 이를 시연하겠습니다. 이제 필요한 모든 패키지와 필요한 데이터를 가져오겠습니다. 여기에서 MPG 변수의 분포와 변수가 어떻게 다른지 살펴보겠습니다. 이를 수행하는 두 가지 일반적인 방법은 히스토그램 과 상자 그림 입니다 .

변수의 분포를 시각화하는 Python의 Seaborn 함수

그래서 displot 기능(배포용 DIS)을 사용하겠습니다 . 그런 다음 데이터 세트가 무엇인지, X축에 놓을 변수는 무엇인지 지정해야 합니다. 그리고 그것으로 우리는 분포를 가지고 있습니다.

이것은 꽤 좋습니다. 이것은 전체 분포와 모양을 매우 쉽게 볼 수 있습니다. 하지만 이러한 배포 시각화에는 몇 가지 단점이 있습니다. 하나는 우리가 사용하고 있는 빈의 수가 거의 임의적이라는 것입니다. 또 다른 것은 변수의 평균이 무엇인지 즉시 알 수는 없다는 것입니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

Seaborn의 좋은 점은 내가 원하는 변수, 위치, 사용 중인 데이터 세트를 설정하면 새로운 시각화를 만드는 데 정말 플러그 앤 처그가 된다는 것입니다. 이제 우리는 boxplot으로 갈 것입니다. Boxplot은 빈을 사용하지 않습니다.

여기서 아이디어는 사분위수 값, 구체적으로 중앙값을 명확하게 볼 수 있고 다른 사분위수 값도 볼 수 있다는 것입니다. 이상치(outlier)가 있고 이것은 매우 정확한 도표입니다. 문제 상자 그림은 일반적으로 많은 비즈니스 사용자가 신경 쓰지 않는 항목이 정확하다는 것입니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

따라서 이 플롯은 통계가 아닌 사람들이 실제로 많은 가치를 얻기에는 약간 어렵습니다. 그리고 다시 데이터를 집계하므로 많은 세부 정보가 손실됩니다. 이것이 어떻게 생겼는지 정확히 알기는 어렵습니다. 이상값이 있음을 알 수 있습니다. 대부분의 값이 여기에 있음을 알 수 있습니다. 히스토그램은 이를 보다 직관적으로 볼 수 있는 방법을 제공합니다.

둘 다 좋은 플롯입니다. 둘 다 목적이 있습니다. Seaborn을 사용하여 시각화하는 몇 가지 대안을 살펴보겠습니다. 우리는 해당 변수의 분포를 위해 MPG를 고수할 것입니다.

boxplot과 유사하게 여기에서 중앙값이 명확하게 표시된 것을 볼 수 있습니다. 사분위수 범위도 볼 수 있으며 전체 분포가 무엇인지 더 잘 볼 수 있습니다. 이것은 히스토그램과도 비슷합니다. 커널 밀도 추정 플롯 또는 KDE 플롯이라고 합니다. 히스토그램의 부드러운 버전입니다. 임의의 비닝을 사용하지 않습니다. 여기에서는 모든 것이 연속 범위로 평활화됩니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

이것은 이 두 가지 접근 방식의 일종의 하이브리드이며 실제로 일부 단점을 처리합니다. 그러나 청중에 따라 이것을 보는 데 정말 어려움을 겪을 수 있습니다. 그들은 그것에 익숙하지 않을 수 있지만 전통적인 접근 방식에 몇 가지 이점이 있습니다.

이 접근 방식에서는 더 이상 데이터를 집계하지 않습니다. 모든 개별 포인트가 플롯됩니다. 이것은 산점도의 요소를 취합니다. 맞습니까? 산점도에 대해 생각해 보면 X 및 Y 좌표에 모든 개별 지점을 표시합니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

마지막으로 stripplot 이 있습니다 . 여기서 우리가 하고 있는 것은 그 분포를 취하고 무작위로 분산시키는 것입니다. 이것은 무작위 과정입니다. 우리는 더 이상 그러한 분포 형태를 만들려고 하지 않습니다. 이것의 문제는 이 모든 덩어리가 서로 부딪히게 되므로 수행하려는 작업에 따라 좋지 않을 수 있다는 것입니다. 어쩌면 그룹별로 색상을 지정하고 싶을 수도 있으므로 이에 대한 옵션이 있습니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

지터를 .25로 변경하고 지터를 높이면 이 지점이 조금 더 퍼지는 것을 볼 수 있습니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

그러나 실행할 때마다 조금씩 다르게 보일 것입니다. 따라서 이를 제거하고 매번 동일하게 만들고 싶다면 numpy를 np로 가져올 수 있습니다 . 이것이 하는 일은 랜덤 시드를 설정하는 것입니다.

난수와 관련된 것을 실행할 때마다 동일한 난수를 사용하게 됩니다. 다시 실행할 때 상황이 임의로 변경되지 않습니다. 이것은 여러분이 하고 있는 모든 종류의 시뮬레이션에 유용할 수 있습니다. 이러한 시각화는 데이터 과학 및 분석에서도 많이 발생합니다. 이제 이 플롯을 실행할 때마다 동일한 모양을 얻게 됩니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

여기에 Y 원점을 추가할 수도 있습니다. 이제 우리는 이중 변형 분포를 만들고 있음을 알 수 있습니다. 우리는 마일리지 분배를 취하여 원산지별로 분류하고 있습니다.

변수의 분포를 시각화하는 Python의 Seaborn 함수

LuckyTemplates에서 Python 스크립트를 사용하는 방법
LuckyTemplates 데이터에서 Python 스크립팅
ProfileReport()를 사용하여 Pandas의 데이터 세트 보고 | LuckyTemplates의 파이썬

결론

이들은 한 변수의 분포를 시각화하는 대안입니다. 그들은 모두 장단점이 있습니다. boxplot이나 히스토그램을 사용하지 말라는 말이 아니라 표시하려는 내용에 따라 다른 옵션이 있다는 뜻입니다.

Python에서 Seaborn 함수를 사용할 때 다른 것만큼 쉽게 만들 수 있습니다. Python 에 대해 더 알고 싶다면 아래 링크를 확인하십시오.

모두 제일 좋다!

댓글 남기기

SharePoint의 계산된 열 | 개요

SharePoint의 계산된 열 | 개요

SharePoint에서 계산된 열의 중요성과 목록에서 자동 계산 및 데이터 수집을 수행하는 방법을 알아보세요.

Power Apps에서 변수 만들기: 컬렉션 작업

Power Apps에서 변수 만들기: 컬렉션 작업

컬렉션 변수를 사용하여 Power Apps에서 변수 만드는 방법 및 유용한 팁에 대해 알아보세요.

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거가 수행할 수 있는 작업과 Microsoft Power Automate의 예를 사용하여 이를 사용하는 방법을 알아보고 이해하십시오!

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름 및 용도에 대해 자세히 알아보세요. 다양한 작업 및 시나리오에 사용할 수 있는 다양한 유형의 흐름에 대해 설명합니다.

흐름에서 Power Automate 종료 작업 제어

흐름에서 Power Automate 종료 작업 제어

조건이 충족되지 않는 경우 흐름에서 작업을 종료하는 Power Automate 종료 작업 컨트롤을 올바르게 사용하는 방법을 알아봅니다.

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 실행 기능에 대해 자세히 알아보고 자신의 앱에서 바로 웹사이트, 전화, 이메일 및 기타 앱과 같은 기타 서비스를 실행하십시오.

Power Automate의 HTTP 요청 – 소개

Power Automate의 HTTP 요청 – 소개

타사 애플리케이션 통합과 관련하여 Power Automate의 HTTP 요청이 작동하는 방식을 배우고 이해합니다.

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop에서 Send Mouse Click을 사용하는 방법을 알아보고 이것이 어떤 이점을 제공하고 흐름 성능을 개선하는지 알아보십시오.

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수의 작동 방식, 다양한 종류, 각 변수가 앱에 기여할 수 있는 사항을 알아보세요.

Power Automate에서 실행할 데스크톱 흐름 예약

Power Automate에서 실행할 데스크톱 흐름 예약

이 자습서에서는 Power Automate를 사용하여 웹 또는 데스크톱에서 작업을 자동화하는 방법을 알려줍니다. 데스크톱 흐름 예약에 대한 포괄적인 가이드를 제공합니다.