Что такое self в Python: примеры из реального мира
Что такое self в Python: примеры из реального мира
В этом руководстве вы узнаете, как создать визуализацию точечной диаграммы с помощью сценария R. Это основано на отчете, представленном для . Вы можете посмотреть полное видео этого урока в нижней части этого блога.
Оглавление
Что такое точечная диаграмма
Точечная диаграмма — это тип визуализации данных, который используется для отображения взаимосвязи между двумя непрерывными переменными. Это график, на котором каждая точка данных представлена точкой, а положение точки на горизонтальной и вертикальной осях соответствует значениям двух переменных.
Диаграммы рассеивания являются полезными инструментами для выявления закономерностей и тенденций в данных. Добавление этого визуального элемента в отчеты LuckyTemplates позволит лучше понять данные, которые вы представляете. И к концу этого урока вы сможете создать точечную диаграмму R, которая выглядит следующим образом:
Это обсуждение разбито на четыре этапа. Сначала вы узнаете, как создать базовую точечную диаграмму. Затем вы примените плавную линию, чтобы показать тренд данных на графике. Третий и четвертый шаги в основном сосредоточены на темах и изменениях форматирования, которые вы можете применить к точечной диаграмме.
Набор данных, используемый в этом примере, представляет собой таблицу, содержащую имя клиента, продолжительность, доход и почасовую ставку.
Создайте базовую точечную диаграмму в визуальном сценарии R Script
Откройте .
Для начала в вашей программе RStudio должны быть установлены три пакета : tidyverse , ggthemes и ggpubr .
Если они у вас не установлены, используйте функцию install.packages() . После этого вам нужно использовать функцию library() , чтобы загрузить их в среду R.
Скопируйте коды библиотеки R и перейдите в LuckyTemplates. Откройте редактор R Script и вставьте код. Вы можете продолжить создание кода R там.
Затем используйте функцию ggplot() для создания точечной диаграммы. Сначала вам нужно указать набор данных, который будет использоваться на диаграмме, следовательно, команда базы данных %>% . В этом случае вместо функции фильтра используется оператор канала .
Чтобы указать набор данных, вам нужно использовать аргумент aes() , а затем указать оси x и y. В данном случае это продолжительность часа и заработка соответственно. Затем используйте функцию geom_point() , чтобы отобразить точки на графике.
Вы можете дополнительно внести изменения в форматирование диаграммы рассеяния, используя различные функции, такие как «цвет» или «форма». Если вы хотите придать диаграмме динамический вид, вы можете установить цвет и размер точек на определенное значение, как показано в примере.
Когда вы запустите код, вы получите этот точечный график в LuckyTemplates. Обратите внимание, что вы получаете большие и более темные круги, когда их эквивалентное значение почасовой ставки выше.
Добавьте плавную линию на график
На следующем шаге вы узнаете, как добавить на диаграмму плавную линию. Гладкая линия — это линия, которая соответствует данным, чтобы помочь вам изучить потенциальные взаимосвязи между двумя переменными.
Чтобы добавить плавную линию, используйте функцию geom_smooth() .
Когда вы запустите сценарий R, точечная диаграмма будет выглядеть так. Гладкая линия теперь показывает тренд данных с доверительным интервалом 95 %.
Вы можете изменить масштаб осей x и y, используя функции scale_x_continuous() и scale_y_continuous() .
В этом случае ось у преобразуется в логарифмическую шкалу, а ось х остается прежней.
Когда вы запускаете код R, результаты теперь будут отображаться в логарифмическом порядке. Гладкая линия также меняется.
Кроме того, поскольку диаграмма автоматически размещает метки на осях, вы можете удалить их с помощью функции labs() .
Форматирование графика рассеяния R
После того как вы создали базовую форму точечной диаграммы, следующим шагом будет настройка ее темы и внешнего вида.
Используйте функцию theme() для форматирования точечной диаграммы в редакторе R Script. И внутри этой функции вы можете добавить другие аргументы для настройки.
Panel.grid.major ( ) и panel.grid.minor() позволяют редактировать тип и цвет линий сетки диаграммы. Если вы хотите удалить линию сетки, используйте функцию element_blank() .
Panel.background и plot.background удалены, чтобы сделать точечную диаграмму прозрачной . Это позволяет гибко размещать диаграмму в любом месте отчета. Если вы хотите удалить легенду на диаграмме, установите для функции legend.position значение «none».
Вы также можете отформатировать строку и текст осей x и y. Вы можете сделать линию толще или тоньше, а текст больше или меньше.
Если вы хотите узнать о других функциях форматирования, которые вы можете использовать в своей диаграмме, вы можете перейти в раздел справки в RStudio . Введите «тема» в строке поиска, и появится список функций форматирования.
В R можно использовать множество функций форматирования. Не забывайте использовать то, что вам нужно, и не переусердствуйте.
Отрегулируйте цвет и диапазон точек данных
В последнем разделе этого руководства вы узнаете, как отформатировать цветовую шкалу и диапазон размеров точек на точечной диаграмме.
Функция scale_colour_viridis_b() предоставляет цветовые карты, однородные для восприятия как в цвете, так и в черно-белом режиме. Они также предназначены для восприятия зрителями с распространенными формами дальтонизма.
Если вы выполните поиск в разделе справки в RStudio, вы увидите различные аргументы, которые можно использовать для форматирования диаграмм. Вы можете переключаться между вариантами, чтобы узнать, какой результат лучше всего соответствует вашему отчету.
Например, функция scale_size_continuous() масштабирует размер точек или фигур на графике в соответствии с непрерывной переменной. Он позволяет указать минимальный и максимальный размер точек, которые должны использоваться на графике.
В этом случае 4 — это минимум, а 17 — максимум.
Вот как выглядит окончательный график рассеяния R.
Заключение
Из этого руководства вы узнали, как создать точечную диаграмму R в LuckyTemplates. Точечная диаграмма — это тип визуализации данных, используемый для отображения взаимосвязи между двумя непрерывными переменными. В LuckyTemplates можно создать точечную диаграмму с помощью пакета ggplot и визуального элемента R Script.
Диаграммы рассеяния являются полезными инструментами для визуализации и выявления закономерностей и тенденций в данных. Они также полезны для выявления выбросов или аномалий.
В целом, создание точечной диаграммы в LuckyTemplates с использованием R — это простой процесс, который позволяет вам воспользоваться мощными возможностями визуализации данных пакета ggplot.
Всего наилучшего,
Хоссейн Сейедага
Что такое self в Python: примеры из реального мира
Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.
В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.
В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.
В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.
Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.
Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.
В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.
Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.
Что такое шлюз LuckyTemplates? Все, что тебе нужно знать