Передача результатов исследований с помощью R Notebook — часть 2

Передача результатов исследований с помощью R Notebook — часть 2

Сегодня мы продолжим тему обмена исследованиями с помощью R Notebook. Мы продолжим работу над базовой структурой, которую вы можете использовать для сообщения результатов исследований с помощью R. Первую часть этой серии, посвященную распространению информации о воспроизводимых исследованиях , см. здесь .

Оглавление

Создание гипотезы

Следующим шагом в нашем отчете является выдвижение гипотезы . Мы создадим еще один раздел на панели просмотра и скроем другие, чтобы мы могли видеть отчеты высокого уровня.

Для гипотезы напишем, что разницы в цене продажи компьютеров с CD-ROM и без него нет.

Передача результатов исследований с помощью R Notebook — часть 2

Создание методов в R Notebook

Мы перейдем к методам , которые будут касаться фактических методов, которые мы будем использовать, чтобы ответить на эту гипотезу. Возможно, нам не нужно делать какую-либо логическую статистику. В зависимости от аудитории, мы будем делать исследовательский отчет высокого уровня в этом сценарии.

Мы скажем, что проведем выборочные тесты с доверительной вероятностью 95% и визуально проверим распределение цен. Если они будут примерно в норме, мы проведем тест.

Передача результатов исследований с помощью R Notebook — часть 2

После того, как мы сохранили нашу гипотезу и методы, мы можем отобразить их в виде файла HTML , документа PDF или документа Word на вкладке «Предварительный просмотр» .

Передача результатов исследований с помощью R Notebook — часть 2

Как только мы отправим это как HTML, это то, что мы увидим в окне рендеринга.

Передача результатов исследований с помощью R Notebook — часть 2

Здесь говорится, что вывод был создан, поэтому давайте перейдем к нашему проводнику, чтобы проверить это. Как только мы откроем это в нашем файле HTML, мы увидим, что это очень похоже на то, что у нас было в кнопке «Предварительный просмотр».

Передача результатов исследований с помощью R Notebook — часть 2

На данный момент мы не видим никаких сообщений об ошибках, и мы также видим возможности для настройки. Мы даже можем написать целую книгу или веб-сайт, используя эти инструменты с помощью R Markdown и R Notebooks .

Вернемся к нашему сценарию и продолжим. Мы запишем методы, которые будем использовать, а также наши результаты. Мы в основном открываем исходный код нашего плана и ясно даем понять, что не бросаем вещи в стену только для того, чтобы посмотреть, что приживется. Мы не импровизируем, когда получаем данные; у нас действительно есть план.

Есть некоторая польза в том, чтобы попробовать много разных вещей, верно? Но в этом подходе мы целенаправленно говорим: «Вот что мы сделаем, а потом мы собираемся сделать это».

Передача результатов исследований с помощью R Notebook — часть 2

Работа с описательной статистикой в ​​R Notebook

Давайте сделаем нашу описательную статистику . Мы хотим найти цену для каждой группы с компакт-диском и без него. Есть несколько способов сделать это. Мы назовем эту группу сводкой и введем этого оператора канала. Если вы не знакомы с оператором канала, вы можете ознакомиться с ресурсами, о которых я говорил ранее.

Затем мы суммируем и подсчитываем записи , чтобы найти среднюю цену = среднюю цену . Наконец, мы хотим распечатать сводку этой группы, а затем запустить ее.

Передача результатов исследований с помощью R Notebook — часть 2

И здесь мы идем. Теперь у нас есть наш стол.

Передача результатов исследований с помощью R Notebook — часть 2

Как я уже говорил ранее, мы хотим знать, сколько наблюдений в каждой группе и какова средняя цена. Мы можем сделать это полностью динамическим с помощью встроенной ссылки.

Мы сделаем групповое резюме и будем использовать операции tidyverse . Мы отфильтруем эту строку, а затем возьмем одно из этих значений и превратим его во что-то, что действительно будет отображаться в нашей встроенной ссылке здесь.

Передача результатов исследований с помощью R Notebook — часть 2

После сохранения перейдите в Preview Notebook , чтобы увидеть результат.

Передача результатов исследований с помощью R Notebook — часть 2

Передача результатов исследований с помощью R Notebook — часть 2

Создание визуализаций в R Notebook

R очень хорошо известен своими возможностями визуализации. Для нашей визуализации мы будем использовать ggplot . Мы поместим цену на ось X, а затем создадим гистограмму . Мы также создадим небольшие множители для фасета, что на самом деле довольно легко сделать в ggplot .

Передача результатов исследований с помощью R Notebook — часть 2

Передача результатов исследований с помощью R Notebook — часть 2

Здесь мы можем изменить многое, например, заголовок, фон, цвет и так далее. Как только мы сохраним это, мы сможем увидеть сюжет. Сейчас он не интерактивен, но в R есть много способов сделать его интерактивным. В этом примере мы делаем только статический график.

Передача результатов исследований с помощью R Notebook — часть 2

Наши результаты показывают что-то похожее на кривую нормального распределения, что означает, что мы должны продолжить наш анализ.

Мы запустим результаты Т-теста и вставим их в отчет. Мы добавим еще один фрагмент R и назовем его cd_test . Если мы запустим это сейчас, результат будет содержать много информации и вытащить из него отдельные элементы будет очень сложно.

Мы будем использовать аккуратную функцию , чтобы представить это в табличном формате. Как только мы выполним аккуратный cd_test , он превратит все в красивую структуру таблицы. Мы также можем распечатать это, чтобы показать в нашем отчете.

Передача результатов исследований с помощью R Notebook — часть 2

Еще одна вещь, которую мы могли бы сделать, это найти нижний и верхний доверительные интервалы. Мы не хотим показывать эту часть, потому что это всего лишь постановка.

Передача результатов исследований с помощью R Notebook — часть 2

В целом, он выглядит как живой и динамичный документ, и это намного лучше, чем копирование и вставка отдельных точек данных и таблиц в отчет. Вы можете отправить это коллеге, и в идеале он может просто щелкнуть «Предварительный просмотр», чтобы узнать, что вы сделали, и иметь возможность использовать это.

Завершение с заключением

Мы приближаемся к концу нашего доклада, так что мы будем писать заключение.

Передача результатов исследований с помощью R Notebook — часть 2

Мы также могли бы включить сюда приложение, чтобы показать наши ресурсы. Хорошая вещь в наличии приложения заключается в том, что если вы в конечном итоге представите это или покажете это кому-то, они спросят, кто ваш источник данных или как что-то было измерено. Это все правильные вопросы, и наличие приложения с ресурсами действительно полезно, потому что тогда вы можете просто указать на приложение.

Передача результатов исследований с помощью R Notebook — часть 2

Мы также можем включить изображение и использовать замещающий текст . Это хорошая практика для описания того, что показывает изображение. Если вы являетесь пользователем HTML, вы можете встроить это изображение с помощью HTML.

Передача результатов исследований с помощью R Notebook — часть 2

Заключение

Для этого урока мы фактически просмотрели весь отчет. Это очень грубый набросок, но нам удалось использовать R Markdown для создания структуры нашего исследовательского отчета.

Мы начали с разговора о воспроизводимости, когда все задокументировано. Вы можете использовать R Markdown и эту платформу для создания веб-сайтов, книг и блогов. Практически любой продукт, который вам нужно создать как аналитику, можно создать с помощью RStudio.

Для дальнейшего чтения, не стесняйтесь проверить мою книгу под названием «Продвижение в аналитику» . Это хорошее базовое введение в аналитику данных и статистический анализ с использованием Excel, Python и R. У меня также есть курсы по R для пользователей LuckyTemplates . В какой-то момент вы также можете увидеть третий курс из этой серии.

Передача результатов исследований с помощью R Notebook — часть 2

Я надеюсь, что вы узнали кое-что из этого руководства по R Notebook, и хотели бы увидеть, как вы в конечном итоге используете эти инструменты.

Джордж Маунт


Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Как сохранить и загрузить файл RDS в R

Как сохранить и загрузить файл RDS в R

Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.

Введение в фильтрацию контекста в LuckyTemplates

Введение в фильтрацию контекста в LuckyTemplates

В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.

Идеи материализации кэшей данных в DAX Studio

Идеи материализации кэшей данных в DAX Studio

В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.

Бизнес-отчетность с использованием LuckyTemplates

Бизнес-отчетность с использованием LuckyTemplates

Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать