Блокноты R для обмена информацией об исследованиях

В этом сообщении блога мы рассмотрим обмен информацией об исследованиях и представление этих результатов с помощью блокнотов R. Мы надеемся, что то, что вы получите от этого руководства, станет основой для отчетов и сообщений о любых результатах исследований с использованием блокнотов R.

Это дает большие преимущества, особенно когда речь идет об идее воспроизводимых исследований . Мы обсудим, что это значит и как это сделать в блокнотах R.

Блокноты R для обмена информацией об исследованиях

Оглавление

Что такое воспроизводимость?

Идея воспроизводимости заключается в том, что любой может проверить ваши результаты, и, учитывая входные данные и процессы, которые вы использовали, они должны быть в состоянии пройти через все это. Есть несколько способов, которыми это может помочь нам в анализе данных: среда, которая делает вещи воспроизводимыми, гарантирует, что люди могут видеть, что было добавлено, возможность легко проверять файл и иметь воспроизводимого издателя.

В идеале кто-то может увидеть, как именно вы попали в отчет и как был создан график или таблица, которые вы использовали, чтобы все было в полностью воспроизводимой среде.

Теперь вам может быть интересно, как что-то вроде LuckyTemplates или Excel вписывается в это. Я бы сказал, что это середина воспроизводимого рабочего процесса. Когда мы думаем, в частности, о запросе мощности , он довольно хорош в воспроизводимости. Подумайте о Прикладных шагах , где очень очевидно увидеть задействованные процессы.

Когда дело доходит до визуализации и отчетов, здесь все становится немного сложнее. Блокноты R являются частью RStudio. У нас есть курс на портале LuckyTemplates, который поможет вам начать работу. Этот , в частности, посвящен R Markdown и R Notebooks .

Итак, если вы знакомы с блокнотом Jupyter , идея состоит в том, что мы можем чередовать текст и код, чтобы создать документ, рассказывающий историю для нашего исследования.

Мы сможем отображать эти результаты в виде множества различных выходных данных. Независимо от того, нужно ли вам создать PDF-файл или преобразовать его в HTML, R Notebooks можно использовать для различных форматов файлов.

Блокноты R для обмена информацией об исследованиях

Для начала откройте свой блокнот R и выберите «Файл», «Новый файл», затем «Блокнот R» в RStudio. Мы будем работать с более старым набором данных в ресурсах с этим очень простым исследовательским вопросом:

Зависит ли цена компьютера от того, есть ли в нем CD-ROM?

Этот вопрос устарел, но всем нам нужно с чего-то начинать. Мы также создадим основу отчета об исследовании и представим результаты исследования, используя эту базовую структуру.

Блокноты R для обмена информацией об исследованиях

Мы увидим что-то подобное в RStudio, и это то, что называется файлом .rmd, который является расширением файла R markdown. Это может немного раздражать, особенно если вы к этому не привыкли, но есть способ предварительно просмотреть отполированный конечный продукт.

Блокноты R для обмена информацией об исследованиях

Эта часть записной книжки представляет собой метаданные, называемые файлом YAML.

Блокноты R для обмена информацией об исследованиях

После этого раздела находятся эти обратные тексты, куда пойдут ваши коды. Затем идет текстовая часть документа с использованием R Markdown . Если вы использовали Markdown раньше, уценка R очень похожа. Мы можем использовать такие вещи, как звездочки и знаки решетки, для разметки и отображения наших текстов.

Давайте перейдем к R Studio и R Notebooks, а затем вместе проведем этот анализ. Нажмите на шестеренку и убедитесь, что там написано «Предварительный просмотр в области просмотра» .

Блокноты R для обмена информацией об исследованиях

Запуск ноутбука R

Мы нажмем кнопку «Предварительный просмотр», и он попросит нас сохранить его. Опять же, это файл RMD, поэтому нам нужно сначала сохранить его. На левой панели мы увидим визуализированный вывод. Теперь, если мы что-то здесь изменим и скажем что-то вроде «Компьютерный анализ» и добавим имя автора, например, Джордж Маунт , его нужно будет взять в кавычки.

Как только мы нажмем «Сохранить» , он автоматически обновится до этого.

Блокноты R для обмена информацией об исследованиях

Итак, давайте поиграем с этим. Здесь уже есть пара заполнителей, и это нормально. Первое, что мы сделаем, это напечатаем «Влияет ли CD-ROM на цену продажи?» Когда мы сохраним это, это будет Header1. Но если мы превратим это в две хеш-метки, получится Header2, и он будет меньше.

Блокноты R для обмена информацией об исследованиях

Следующим шагом является введение , где мы можем указать, почему это важно. Например, мы можем сказать, что CD-ROM — лучшая вещь или что-то в этом роде. Если вы работаете над потребительскими отчетами или работаете в отделе маркетинга, вы пытаетесь понять, какие функции действительно важны или что ищут потребители.

Мы вызовем пакеты R и начнем. Одна приятная вещь, которая мне здесь нравится, это то, что мы можем использовать HTML в R Notebook. Например, если мы хотим оставить комментарий для себя, мы можем сделать что-то вроде этого.

Блокноты R для обмена информацией об исследованиях

Когда мы сохраняем это, оно вообще не отображается. Поэтому мы просто оставляем это как комментарий для себя в тексте. Это то, что я хотел бы сделать в таких местах, как MS Word.

Представляем пакеты в R Notebooks

Следующим шагом будет использование этого графика кода здесь и добавление пары настроек. Мы можем использовать Python и SQL, но в этом примере мы используем R.

Мы прочитаем все пакеты, которые нам нужны. Если на вашем компьютере их нет, вам может потребоваться их установить.

Блокноты R для обмена информацией об исследованиях

Опять же, это не полный отчет. Мы пройдемся по скелету, чтобы показать вам пару вещей, которые нужно знать о R Markdown.

Итак, теперь мы собираемся представить, откуда мы получаем наши данные и что делает их важными. В этом случае можно сказать, что нашим источником является Journal of Applied Econometrics. Когда мы сделаем эту штуку со звездочкой, она превратится в курсив.

Блокноты R для обмена информацией об исследованиях

Затем мы прочитаем файл в Excel и воспользуемся R для его ввода. Как видите, данные уже выглядят довольно хорошо, что является еще одной интересной особенностью R Notebooks.

Блокноты R для обмена информацией об исследованиях

В зависимости от выходного формата это может даже появиться. Если вы используете HTML, ваш пользователь может пролистать данные и выполнить некоторые базовые действия. Здорово, что мы действительно можем делать это в живых документах.

Блокноты R для обмена информацией об исследованиях

Добавление динамической ссылки в R Notebooks

Теперь допустим, что мы хотим включить динамическую ссылку в текст данных. Мы хотим, чтобы это регулярно обновлялось, потому что это может быть не одно и то же каждый раз, когда мы в отчете, верно? Поэтому мы сделаем динамическую ссылку здесь, в строке, прямо в тексте.

Для всех этих кодов есть шпаргалка и справочное руководство. Перейдите в раздел «Справка» и выберите вариант для R Markdown, чтобы просмотреть все различные настройки. Вероятно, не стоит пытаться их запомнить, потому что их много, и вы можете просто использовать это вместо этого.

Блокноты R для обмена информацией об исследованиях

Мы снова вставим фрагмент R и включим FALSE , nrows и ncols .

Блокноты R для обмена информацией об исследованиях

После того, как это будет запущено и выполнено, мы можем даже перейти в среду R, чтобы увидеть, было ли оно превращено в объекты.

Блокноты R для обмена информацией об исследованиях

Еще одна приятная вещь: если вы просто разбрасываетесь идеями и хотите знать, как это будет выглядеть на самом деле, вы можете просто использовать консоль внизу. Мы можем запустить его в консоли и посмотреть, как будет выглядеть результат.

Блокноты R для обмена информацией об исследованиях

Вернемся к нашей панели просмотра. Теперь этот раздел здесь вообще не отображается в отчете. Это хорошо, если вы хотите использовать какой-то объект, но не хотите показывать какой-либо код.

Блокноты R для обмена информацией об исследованиях

Мы используем эти обратные тексты для nrows и ncols, чтобы сохранить динамику. Если у вас есть отчет в формате PDF и вам нужно автоматически изменять эти числа, вместо того, чтобы жестко кодировать их неделю за неделей, вы можете использовать эти встроенные ссылки.

Блокноты R для обмена информацией об исследованиях

Мы снова изучаем данные и проверяем цены на компьютеры.

Блокноты R для обмена информацией об исследованиях

Как только мы запустим этот код, мы увидим хорошо отформатированную описательную статистику. В зависимости от размера данных он довольно отзывчив и реагирует на размер файла.

Блокноты R для обмена информацией об исследованиях

Заключение

В этом руководстве мы обсудили важность разработки воспроизводимых исследований и оптимизации процесса передачи результатов исследований с помощью R Notebooks. Таким образом, мы можем быстро и легко воспроизвести исходные результаты и проследить, как они были получены. 

Пожалуйста, следите за продолжением этого руководства во второй части этой серии.

Джордж Маунт

Leave a Comment

Расчет недельных продаж с помощью DAX в LuckyTemplates

Расчет недельных продаж с помощью DAX в LuckyTemplates

В этом руководстве показано, как в конечном итоге можно рассчитать разницу между еженедельными результатами продаж с помощью DAX в LuckyTemplates.

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Как сохранить и загрузить файл RDS в R

Как сохранить и загрузить файл RDS в R

Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.

Введение в фильтрацию контекста в LuckyTemplates

Введение в фильтрацию контекста в LuckyTemplates

В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.

Идеи материализации кэшей данных в DAX Studio

Идеи материализации кэшей данных в DAX Studio

В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.

Бизнес-отчетность с использованием LuckyTemplates

Бизнес-отчетность с использованием LuckyTemplates

Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.