RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

ggplot2 패키지는 그래프와 플롯을 구축하는 가장 포괄적인 방법입니다 . New York Times 및 The Economist와 같은 회사는 시각화를 생성하기 위해 ggplot2를 많이 사용하고 있습니다. 이 도구를 사용하는 대기업에서는 ggplot2를 사용하여 지터 플롯과 같은 시각화를 생성하는 방법에 대한 지식 기반을 갖는 것이 중요합니다.

에서 ggplot2를 사용하여 지터 플롯을 만드는 방법을 배웁니다 . ggplot2의 그래픽 문법을 이해하면 모든 그래프 또는 플롯을 함께 연결할 수 있습니다.

지터플롯 은 숫자 데이터 포인트 집합의 분포를 표시하는 데 사용되는 일종의 산점도 입니다. 플롯 이름의 "지터"는 x축과 y축을 따라 각 기호의 위치에 추가되는 임의의 변형을 나타냅니다.

이 변형은 심볼이 겹치는 것을 방지하고 플롯의 특정 영역에 포인트 밀도가 높은 경우 데이터 포인트 분포를 더 쉽게 볼 수 있도록 합니다.

조밀하게 채워진 플롯이 있는 경우 jitterplot을 사용하면 시각화를 더 쉽게 이해할 수 있습니다. 상자 그림이나 히스토그램 의 대안인 범주별 분포를 그리는 데 사용할 수도 있습니다 .

목차

R에서 지터 플롯 만들기

이 데모에서는 tidyverse 데이터 세트가 사용됩니다.

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

먼저 ggplot( ) 함수를 사용하여 산점도를 만듭니다 . 이 경우 x축은 연도이고 y축은 mpg 데이터 세트입니다.

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

코드를 실행하면 플롯에 y축에 대해 직선을 형성하는 점이 표시되는 것을 볼 수 있습니다.

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

geom_jitter( ) 함수를 사용하여 그래프에 다른 레이어를 추가합니다. 코드를 실행하면 플롯의 포인트가 이동한 것을 볼 수 있습니다. 코드를 실행할 때마다 포인트가 계속 이동합니다.

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

포인트가 지속적으로 이동하지 않도록 하려면 set.seed( ) 기능을 사용하십시오. 괄호 안에 임의의 숫자를 입력합니다. 이 경우에는 1234입니다. 코드를 실행한 후 실행을 반복해서 클릭해도 플롯이 동일하게 유지되는 것을 볼 수 있습니다.

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

범주형 변수로 지터 플롯 생성

범주형 변수에 geom_jitter( ) 함수를 사용할 수도 있습니다 .

동일한 인수를 사용하여 x축을 mpg로, y축을 origin으로 변경해 보겠습니다. 새 코드 줄을 실행하면 데이터를 직선으로 표시하는 대신 플롯에 무작위로 분포하는 것을 볼 수 있습니다.

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

이렇게 하면 각 범주에 대한 개별 관찰과 그 차이를 시각화하는 데 도움이 됩니다. 이 경우 한 오리진과 다른 오리진의 일반적인 마일리지를 볼 수 있습니다.

aes( ) 함수 에 다른 인수를 추가하여 플롯에 색상을 추가할 수 있습니다 . 데이터 세트의 특정 데이터 값에 대한 포인트 크기를 설정할 수도 있습니다.

RStudio에서 Ggplot2를 사용하여 지터 플롯 생성

이 예에서 지터 플롯을 사용하면 자동차가 가장 많은 출처와 연비가 더 좋은 출처를 쉽게 식별할 수 있습니다.

코드에 설정된 크기 때문에 플롯이 과포화되어 보입니다. 기본 설정이나 비즈니스 요구 사항에 따라 데이터 포인트의 크기나 색상을 변경할 수 있습니다.

결론

지터 플롯은 시각화에 새로운 형태의 통찰력을 제공하는 방법 중 하나입니다. 사용자가 데이터에서 일어나는 일을 더 잘 이해할 수 있도록 도와줍니다. 이 플롯은 분포를 플로팅하기 위한 일반적인 히스토그램 또는 상자 플롯에 대한 훌륭한 대안입니다.

데이터 세트의 기본 구조를 효과적으로 이해할 수 있는 기능을 통해 지터 플롯은 통계, 데이터 분석 및 머신 러닝과 같은 다양한 분야에서 유용한 도구가 됩니다. 전반적으로 지터 플롯은 수치 데이터 포인트의 분포를 명확하고 이해하기 쉽게 나타내므로 데이터 시각화 및 분석을 위한 강력한 도구가 됩니다.

모두 제일 좋다,

조지 마운트


파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

R에서 RDS 파일을 저장하고 로드하는 방법

R에서 RDS 파일을 저장하고 로드하는 방법

R의 .rds 파일에서 개체를 저장하고 로드하는 방법을 배웁니다. 이 블로그에서는 R에서 LuckyTemplates로 개체를 가져오는 방법도 다룹니다.

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

이 DAX 코딩 언어 자습서에서는 GENERATE 함수를 사용하는 방법과 측정값 제목을 동적으로 변경하는 방법을 알아봅니다.

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

이 자습서에서는 다중 스레드 동적 시각적 개체 기술을 사용하여 보고서의 동적 데이터 시각화에서 통찰력을 만드는 방법을 다룹니다.

LuckyTemplates의 컨텍스트 필터링 소개

LuckyTemplates의 컨텍스트 필터링 소개

이 기사에서는 필터 컨텍스트를 살펴보겠습니다. 필터 컨텍스트는 모든 LuckyTemplates 사용자가 처음에 배워야 하는 주요 주제 중 하나입니다.

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates Apps 온라인 서비스가 다양한 소스에서 생성된 다양한 보고서 및 인사이트를 관리하는 데 어떻게 도움이 되는지 보여주고 싶습니다.

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

LuckyTemplates에서 측정 분기 및 DAX 수식 결합과 같은 기술을 사용하여 수익 마진 변경을 해결하는 방법을 알아봅니다.

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

이 자습서에서는 데이터 캐시의 구체화 아이디어와 결과 제공 시 DAX 성능에 미치는 영향에 대해 설명합니다.

LuckyTemplates를 사용한 비즈니스 보고

LuckyTemplates를 사용한 비즈니스 보고

지금까지 Excel을 계속 사용하고 있다면 지금이 비즈니스 보고 요구 사항에 LuckyTemplates를 사용하기 시작하는 가장 좋은 시기입니다.

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것