Python에서 병렬 좌표 플롯을 만드는 방법

Python에서 병렬 좌표 플롯을 만드는 방법

병렬 좌표 플롯은 동일한 수치 데이터를 공유하는 여러 변수 간의 관계를 표시하는 데 사용되는 유용한 시각화 도구입니다. LuckyTemplates에서 이러한 플롯은 사용하고 쉽게 만들고 스타일을 지정할 수 있는 매우 간단한 Python 코드로 만들어집니다. 

오늘 블로그에서는 Python을 사용하여 다변량 또는 병렬 좌표 플롯을 만드는 방법을 배웁니다 . 데이터 준비에서 더 나은 가독성을 위해 플롯 사용자 정의에 이르기까지 프로세스를 단계별로 안내합니다. 이 블로그 하단에서 이 튜토리얼의 전체 비디오를 볼 수 있습니다

목차

Python의 병렬 좌표 플롯: 샘플 1

이것은 우리의 첫 번째 플롯입니다. 세 개의 변수(변수 A, B, C)와 항목 1과 2를 나타내는 두 개의 선이 표시됩니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

즉, 항목 1과 항목 2에 각각 하나씩 두 개의 데이터 세트가 있습니다. 그리고 각 데이터 세트에는 세 개의 변수가 있습니다. 

플롯이 어떻게 구성되었는지 더 잘 이해하기 위해 데이터를 살펴보겠습니다. 

그래프를 강조 표시하여 시작하십시오. 데이터를 클릭합니다

Python에서 병렬 좌표 플롯을 만드는 방법

매우 간단한 데이터가 포함된 테이블이 나타납니다. 테이블 삽입 옵션을 사용하여 생성되었습니다. 열에는 각 행에서 분리된 각 항목에 대한 변수 A, B 및 C가 있음을 알 수 있습니다.

Python에서 병렬 좌표 플롯을 만드는 방법

우리는 간단한 데이터를 가지고 있지만 그것을 매우 의미 있는 것으로 바꿀 수 있습니다. 예를 들어 플롯에서 데이터 간의 관계가 상당히 "낮음"임을 확인할 수 있습니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

설명을 위해 이 플롯을 데이터와 비교할 수 있습니다. 그래프와 같이 항목 1의 변수 B는 100, 항목 2의 변수 B는 115입니다. 

항목과 변수가 어떻게 관련되어 있는지 식별할 수도 있습니다. 예를 들어 변수 A가 B보다 낮고 변수 C가 셋 중 가장 낮다는 것을 쉽게 알 수 있습니다.

Python에서 병렬 좌표 플롯을 만드는 방법

플롯 파이썬 코드

이제 실제 플롯에 사용된  Python 코드 로 진행하겠습니다 .

Visualizations 창 에서 Python 시각적 개체를 선택하여 시작합니다

Python에서 병렬 좌표 플롯을 만드는 방법

첫 번째 그래프를 강조 표시하여 Python 스크립트 편집기를 엽니다 . 

Python에서 병렬 좌표 플롯을 만드는 방법

먼저 matplotlib.pyplot을 가져와 변수 plt로 저장합니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

그런 다음 pandas.plotting 기능을 가져옵니다 . Pandas는 LuckyTemplates에서 데이터 조작 라이브러리 역할을 합니다. 주로 데이터를 조작하는 데 사용되지만 플로팅 기능도 있습니다.

pandas.plotting 에서 parallel_coordinates를 가져오겠습니다 . Parallel_coordinates는 그래프 생성을 위한 기본 기능입니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

파이썬으로 플롯 만들기

13행에서 # make a plot을 작성하여 수행할 작업을 문서화합니다 .

Python에서 병렬 좌표 플롯을 만드는 방법

우리는 parallel_coordinates를 사용 하고 데이터 세트를 전달합니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

3행에서 pandas.DataFrame( ) 함수를 사용하여 데이터 세트가 생성된 것을 볼 수 있습니다 . 그런 다음 항목, 변수 A, 변수 B 및 변수 C를 추가하면 목록 에 반영됩니다 . 

4행에서 데이터 세트는 dataset.drop_duplicates( )를 사용하여 중복 제거됩니다.

Python에서 병렬 좌표 플롯을 만드는 방법

시각화 창 으로 이동하여 추가한 값을 볼 수 있습니다.

Python에서 병렬 좌표 플롯을 만드는 방법

이러한 값 중 하나를 제거하면 시각적 개체에 영향을 미칩니다. 예를 들어 변수 C를 제거하면 그에 따라 좌표가 변경되어 값 어떻게 작동하는지 보여줍니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

필드 창의 데이터 아래에 있는 변수 옆에 있는 상자를 선택하여 변수 C를 다시 가져오겠습니다 .

다음으로 몇 가지 다른 인수를 사용하는 parallel_coordinates 함수를 전달합니다 . 우리의 경우에는 데이터 세트항목을 가져와서 데이터 세트의 유형과 차원을 제공합니다.

Python에서 병렬 좌표 플롯을 만드는 방법

함수에서 항목을 제거하고 실행하면 시각적 개체가 작동하지 않습니다.

우리는 parallel_coordinates( ) 함수에 class_column인 1개의 필수 위치 인수가 누락되었다는 Python 스크립트 오류가 발생합니다

Python에서 병렬 좌표 플롯을 만드는 방법

이제 항목을 다시 추가해 보겠습니다 . 위치이기 때문에 클래스 좌표를 작성할 필요가 없습니다. 완료되면 코드를 실행할 수 있습니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

파이썬에서 플롯 보여주기

다음 단계는 플롯을 표시하는 것이므로 16행에서 # show the plot을 작성하여 수행할 작업을 문서화합니다 .

Python에서 병렬 좌표 플롯을 만드는 방법

이전에 matplotlib.pyplot을 가져와서 plt 로 저장했음을 기억하십시오 . 플롯을 표시하려면  plt.show( ) 함수가 필요하기 때문에 그렇게 했습니다 .

Python에서 병렬 좌표 플롯을 만드는 방법

Python의 병렬 좌표 플롯: 샘플 2

두 번째 플롯은 petal_length, petal_width, sepal_length 및 sepal_width를 보여주는 홍채 데이터셋 입니다. 첫 번째 그래프에 비해 스타일이 조금 더 있습니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

이 데이터 세트는 Python 코드로 생성되었습니다. 

데이터를 보려면 데이터 변환을 클릭 하고 iris_dataset로 이동합니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

데이터 세트에는 꽃받침 길이 , 꽃받침 너비 , 꽃잎 길이꽃잎 너비 와 같은 차원에 대한 열이 포함되어 있습니다 . 유형 에 대한 열도 있습니다

Python에서 병렬 좌표 플롯을 만드는 방법

데이터 세트 Python 코드

데이터는 Python 코드를 사용하여 쉽게 가져왔습니다. 소스 로 이동하여 Python 스크립트를 표시합니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

Python 코드에는 두 줄만 있습니다. 첫 번째 줄에서 seaborn을 가져와 변수 sns 로 저장했습니다 . 데이터셋의 이름을 iris_dataset 로 지정 하고 sns 변수를 사용하여 sns.load_dataset('iris') 함수를 사용하여 데이터셋을 로드했습니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

확인을 클릭하여 위에서 본 데이터를 얻습니다. 데이터를 탐색하고 완료되면 닫기 및 적용 > 닫기 로 이동하여 데이터 세트를 닫을 수 있습니다 . 

Python에서 병렬 좌표 플롯을 만드는 방법

Python에서 플롯 스타일 지정

보다 양식화된 그래프를 위해 Python 스크립트 편집기를 열려면 두 번째 플롯을 클릭합니다.

matplotlib.pyplot을 plt 로 가져오는 것으로 시작합니다

Python에서 병렬 좌표 플롯을 만드는 방법

그런 다음 plt.style.use('dark_background') 함수를 사용하여 시각적 스타일을 지정합니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

matplotlib의 스타일 시트 참조를 사용하여 선호하는 스타일을 기반으로 배경을 쉽게 사용자 지정할 수 있습니다 . 우리의 경우 어두운 배경을 사용했습니다.

Python에서 병렬 좌표 플롯을 만드는 방법

또한 일반적으로 사용되는 스타일인 ggplot 을 사용해 봅시다 .

Python에서 병렬 좌표 플롯을 만드는 방법

실행하면 다음과 같은 시각적 개체가 표시됩니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

그런 다음 pandas.plotting 에서 parallel_coordinates를 가져와 그래프에 대한 pandas 함수를 로드합니다

Python에서 병렬 좌표 플롯을 만드는 방법

플롯을 만들기 위해 데이터 세트를 가져오고 종을 클래스로 설정합니다

Python에서 병렬 좌표 플롯을 만드는 방법

첫 번째 플롯과 비교하여 다른 색상을 얻기 위한 색상 맵인 추가 매개변수를 추가합니다 . matplotlib 변수 plt.get_cmap을 사용하여 전달합니다. 

Python에서 병렬 좌표 플롯을 만드는 방법

matplotlib의 Colormap 참조 에서 선택할 수 있는 많은 matplotlib 색상 변수가 있습니다 .

Python에서 병렬 좌표 플롯을 만드는 방법

예를 들어 현재 Qualitative 컬러맵의 Set 2를 사용하고 있지만 이를 Cyclic 컬러맵의 hsv 와 같은 다른 색상으로 변경할 수도 있습니다 . 

Python에서 병렬 좌표 플롯을 만드는 방법

다음과 같은 플롯을 얻으려면 실행을 클릭하십시오. 

Python에서 병렬 좌표 플롯을 만드는 방법

Hsv는 데이터에서 그다지 좋아 보이지 않지만 플롯에 가장 적합한 컬러맵을 찾을 때까지 놀 수 있습니다. 


Python 상관 관계: ProfileReport()를 사용하여 Pandas에서 시각적 데이터 세트 만들기 가이드
| 변수 분포를 시각화하기 위한 Python 의 LuckyTemplates Seaborn 함수

결론

이 자습서에서는 Python에서 병렬 좌표 플롯을 만드는 기본 사항을 다뤘습니다. 데이터를 준비하고, 플롯을 만들고, 더 나은 가독성을 위해 플롯을 사용자 정의하는 과정을 거쳤습니다. 

병렬 좌표 플롯은 고차원 데이터를 시각화하기 위한 강력한 도구이며 금융, 엔지니어링 및 기계 학습을 포함한 다양한 분야에서 사용할 수 있습니다. 이제 Python 에서 병렬 좌표 플롯을 만드는 방법을 알았으므로 이를 사용하여 자체 데이터를 더 잘 이해하고 시각화할 수 있습니다.

모두 제일 좋다,

개림 홀랜드


파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

R에서 RDS 파일을 저장하고 로드하는 방법

R에서 RDS 파일을 저장하고 로드하는 방법

R의 .rds 파일에서 개체를 저장하고 로드하는 방법을 배웁니다. 이 블로그에서는 R에서 LuckyTemplates로 개체를 가져오는 방법도 다룹니다.

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

이 DAX 코딩 언어 자습서에서는 GENERATE 함수를 사용하는 방법과 측정값 제목을 동적으로 변경하는 방법을 알아봅니다.

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

이 자습서에서는 다중 스레드 동적 시각적 개체 기술을 사용하여 보고서의 동적 데이터 시각화에서 통찰력을 만드는 방법을 다룹니다.

LuckyTemplates의 컨텍스트 필터링 소개

LuckyTemplates의 컨텍스트 필터링 소개

이 기사에서는 필터 컨텍스트를 살펴보겠습니다. 필터 컨텍스트는 모든 LuckyTemplates 사용자가 처음에 배워야 하는 주요 주제 중 하나입니다.

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates Apps 온라인 서비스가 다양한 소스에서 생성된 다양한 보고서 및 인사이트를 관리하는 데 어떻게 도움이 되는지 보여주고 싶습니다.

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

LuckyTemplates에서 측정 분기 및 DAX 수식 결합과 같은 기술을 사용하여 수익 마진 변경을 해결하는 방법을 알아봅니다.

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

이 자습서에서는 데이터 캐시의 구체화 아이디어와 결과 제공 시 DAX 성능에 미치는 영향에 대해 설명합니다.

LuckyTemplates를 사용한 비즈니스 보고

LuckyTemplates를 사용한 비즈니스 보고

지금까지 Excel을 계속 사용하고 있다면 지금이 비즈니스 보고 요구 사항에 LuckyTemplates를 사용하기 시작하는 가장 좋은 시기입니다.

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것