Что такое self в Python: примеры из реального мира
Что такое self в Python: примеры из реального мира
Сегодня мы продолжим тему обмена исследованиями с помощью R Notebook. Мы продолжим работу над базовой структурой, которую вы можете использовать для сообщения результатов исследований с помощью R. Первую часть этой серии, посвященную распространению информации о воспроизводимых исследованиях , см. здесь .
Оглавление
Создание гипотезы
Следующим шагом в нашем отчете является выдвижение гипотезы . Мы создадим еще один раздел на панели просмотра и скроем другие, чтобы мы могли видеть отчеты высокого уровня.
Для гипотезы напишем, что разницы в цене продажи компьютеров с CD-ROM и без него нет.
Создание методов в R Notebook
Мы перейдем к методам , которые будут касаться фактических методов, которые мы будем использовать, чтобы ответить на эту гипотезу. Возможно, нам не нужно делать какую-либо логическую статистику. В зависимости от аудитории, мы будем делать исследовательский отчет высокого уровня в этом сценарии.
Мы скажем, что проведем выборочные тесты с доверительной вероятностью 95% и визуально проверим распределение цен. Если они будут примерно в норме, мы проведем тест.
После того, как мы сохранили нашу гипотезу и методы, мы можем отобразить их в виде файла HTML , документа PDF или документа Word на вкладке «Предварительный просмотр» .
Как только мы отправим это как HTML, это то, что мы увидим в окне рендеринга.
Здесь говорится, что вывод был создан, поэтому давайте перейдем к нашему проводнику, чтобы проверить это. Как только мы откроем это в нашем файле HTML, мы увидим, что это очень похоже на то, что у нас было в кнопке «Предварительный просмотр».
На данный момент мы не видим никаких сообщений об ошибках, и мы также видим возможности для настройки. Мы даже можем написать целую книгу или веб-сайт, используя эти инструменты с помощью R Markdown и R Notebooks .
Вернемся к нашему сценарию и продолжим. Мы запишем методы, которые будем использовать, а также наши результаты. Мы в основном открываем исходный код нашего плана и ясно даем понять, что не бросаем вещи в стену только для того, чтобы посмотреть, что приживется. Мы не импровизируем, когда получаем данные; у нас действительно есть план.
Есть некоторая польза в том, чтобы попробовать много разных вещей, верно? Но в этом подходе мы целенаправленно говорим: «Вот что мы сделаем, а потом мы собираемся сделать это».
Работа с описательной статистикой в R Notebook
Давайте сделаем нашу описательную статистику . Мы хотим найти цену для каждой группы с компакт-диском и без него. Есть несколько способов сделать это. Мы назовем эту группу сводкой и введем этого оператора канала. Если вы не знакомы с оператором канала, вы можете ознакомиться с ресурсами, о которых я говорил ранее.
Затем мы суммируем и подсчитываем записи , чтобы найти среднюю цену = среднюю цену . Наконец, мы хотим распечатать сводку этой группы, а затем запустить ее.
И здесь мы идем. Теперь у нас есть наш стол.
Как я уже говорил ранее, мы хотим знать, сколько наблюдений в каждой группе и какова средняя цена. Мы можем сделать это полностью динамическим с помощью встроенной ссылки.
Мы сделаем групповое резюме и будем использовать операции tidyverse . Мы отфильтруем эту строку, а затем возьмем одно из этих значений и превратим его во что-то, что действительно будет отображаться в нашей встроенной ссылке здесь.
После сохранения перейдите в Preview Notebook , чтобы увидеть результат.
Создание визуализаций в R Notebook
R очень хорошо известен своими возможностями визуализации. Для нашей визуализации мы будем использовать ggplot . Мы поместим цену на ось X, а затем создадим гистограмму . Мы также создадим небольшие множители для фасета, что на самом деле довольно легко сделать в ggplot .
Здесь мы можем изменить многое, например, заголовок, фон, цвет и так далее. Как только мы сохраним это, мы сможем увидеть сюжет. Сейчас он не интерактивен, но в R есть много способов сделать его интерактивным. В этом примере мы делаем только статический график.
Наши результаты показывают что-то похожее на кривую нормального распределения, что означает, что мы должны продолжить наш анализ.
Мы запустим результаты Т-теста и вставим их в отчет. Мы добавим еще один фрагмент R и назовем его cd_test . Если мы запустим это сейчас, результат будет содержать много информации и вытащить из него отдельные элементы будет очень сложно.
Мы будем использовать аккуратную функцию , чтобы представить это в табличном формате. Как только мы выполним аккуратный cd_test , он превратит все в красивую структуру таблицы. Мы также можем распечатать это, чтобы показать в нашем отчете.
Еще одна вещь, которую мы могли бы сделать, это найти нижний и верхний доверительные интервалы. Мы не хотим показывать эту часть, потому что это всего лишь постановка.
В целом, он выглядит как живой и динамичный документ, и это намного лучше, чем копирование и вставка отдельных точек данных и таблиц в отчет. Вы можете отправить это коллеге, и в идеале он может просто щелкнуть «Предварительный просмотр», чтобы узнать, что вы сделали, и иметь возможность использовать это.
Завершение с заключением
Мы приближаемся к концу нашего доклада, так что мы будем писать заключение.
Мы также могли бы включить сюда приложение, чтобы показать наши ресурсы. Хорошая вещь в наличии приложения заключается в том, что если вы в конечном итоге представите это или покажете это кому-то, они спросят, кто ваш источник данных или как что-то было измерено. Это все правильные вопросы, и наличие приложения с ресурсами действительно полезно, потому что тогда вы можете просто указать на приложение.
Мы также можем включить изображение и использовать замещающий текст . Это хорошая практика для описания того, что показывает изображение. Если вы являетесь пользователем HTML, вы можете встроить это изображение с помощью HTML.
Заключение
Для этого урока мы фактически просмотрели весь отчет. Это очень грубый набросок, но нам удалось использовать R Markdown для создания структуры нашего исследовательского отчета.
Мы начали с разговора о воспроизводимости, когда все задокументировано. Вы можете использовать R Markdown и эту платформу для создания веб-сайтов, книг и блогов. Практически любой продукт, который вам нужно создать как аналитику, можно создать с помощью RStudio.
Для дальнейшего чтения, не стесняйтесь проверить мою книгу под названием «Продвижение в аналитику» . Это хорошее базовое введение в аналитику данных и статистический анализ с использованием Excel, Python и R. У меня также есть курсы по R для пользователей LuckyTemplates . В какой-то момент вы также можете увидеть третий курс из этой серии.
Я надеюсь, что вы узнали кое-что из этого руководства по R Notebook, и хотели бы увидеть, как вы в конечном итоге используете эти инструменты.
Джордж Маунт
Что такое self в Python: примеры из реального мира
Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.
В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.
В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.
В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.
Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.
Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.
В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.
Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.
Что такое шлюз LuckyTemplates? Все, что тебе нужно знать