Создание графика джиттера с помощью Ggplot2 в RStudio

Пакет ggplot2 — наиболее полный способ построения графиков и графиков. Такие фирмы, как New York Times и The Economist, активно используют ggplot2 для создания своих визуализаций. Для крупных компаний, использующих этот инструмент, важно иметь базу знаний о том, как использовать ggplot2 для создания визуализаций, таких как график джиттера.

В этом руководстве вы узнаете, как создать график джиттера с помощью ggplot2 в . Как только вы поймете грамматику графики в ggplot2, вы сможете связать воедино любой график или график.

График дрожания — это тип графика рассеяния , используемый для отображения распределения набора точек числовых данных. «Дрожание» в названии графика относится к случайным изменениям, которые добавляются к положению каждого символа по осям x и y.

Этот вариант помогает предотвратить наложение символов и упрощает просмотр распределения точек данных в случаях высокой плотности точек в определенных областях графика.

Если у вас густонаселенный график, флуктуация может облегчить понимание вашей визуализации. Вы также можете использовать его для построения графиков распределения по категориям, что является альтернативой ящичной диаграмме или гистограмме .

Оглавление

Создание графика джиттера в R

Для этой демонстрации используется набор данных tidyverse .

Создание графика джиттера с помощью Ggplot2 в RStudio

Сначала создайте точечную диаграмму с помощью функции ggplot() . В этом случае ось X — это год, а ось Y — набор данных о милях на галлон.

Создание графика джиттера с помощью Ggplot2 в RStudio

Когда вы запустите код, вы увидите, что на графике показаны точки, образующие прямую линию относительно оси Y.

Создание графика джиттера с помощью Ggplot2 в RStudio

Используйте функцию geom_jitter() , чтобы добавить еще один слой к графику. Когда вы запустите код, вы увидите, что точки на графике сместились. Точки будут продолжать смещаться каждый раз, когда вы запускаете код.

Создание графика джиттера с помощью Ggplot2 в RStudio

Чтобы остановить постоянное смещение точек, используйте функцию set.seed ( ) . Внутри скобок введите любое случайное число. В данном случае это 1234. После запуска кода вы увидите, что график остается прежним, даже если вы несколько раз нажимаете кнопку «Выполнить».

Создание графика джиттера с помощью Ggplot2 в RStudio

Создание графика дрожания с категориальными переменными

Вы также можете использовать функцию geom_jitter() для категориальных переменных.

Используя тот же аргумент, давайте изменим ось X на мили на галлон и ось Y на начало координат. Когда вы запустите новую строку кода, вы увидите, что вместо того, чтобы отображать данные прямыми линиями, они случайным образом распределяются на графике.

Создание графика джиттера с помощью Ggplot2 в RStudio

Это поможет вам визуализировать отдельные наблюдения для каждой категории и то, как они различаются. В этом случае вы можете увидеть типичный пробег одного источника по сравнению с другим.

Вы можете добавить цвет к графику, добавив еще один аргумент в функцию aes() . Вы также можете установить размер точек для определенного значения данных в вашем наборе данных.

Создание графика джиттера с помощью Ggplot2 в RStudio

В этом примере график джиттера упростил определение источников с наибольшим количеством автомобилей и автомобилей с большим пробегом.

Из-за заданного в коде размера график выглядит перенасыщенным. Вы можете изменить размер или цвет точек данных в зависимости от ваших предпочтений или бизнес-требований.

Заключение

График дрожания — это один из способов привнести новую форму понимания в ваши визуализации. Это помогает пользователям лучше понять, что происходит с данными. Этот график является отличной альтернативой типичной гистограмме или блочной диаграмме для построения графиков распределения.

Способность эффективно понимать базовую структуру набора данных делает графики джиттера ценным инструментом в различных областях, таких как статистика, анализ данных и машинное обучение. В целом графики джиттера обеспечивают четкое и простое для понимания представление распределения точек числовых данных, что делает их мощным инструментом для визуализации и анализа данных.

Всего наилучшего,

Джордж Маунт

Leave a Comment

Расчет недельных продаж с помощью DAX в LuckyTemplates

Расчет недельных продаж с помощью DAX в LuckyTemplates

В этом руководстве показано, как в конечном итоге можно рассчитать разницу между еженедельными результатами продаж с помощью DAX в LuckyTemplates.

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Как сохранить и загрузить файл RDS в R

Как сохранить и загрузить файл RDS в R

Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.

Введение в фильтрацию контекста в LuckyTemplates

Введение в фильтрацию контекста в LuckyTemplates

В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.

Идеи материализации кэшей данных в DAX Studio

Идеи материализации кэшей данных в DAX Studio

В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.

Бизнес-отчетность с использованием LuckyTemplates

Бизнес-отчетность с использованием LuckyTemplates

Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.