Наборы данных в Pandas с помощью ProfileReport () | Python в LuckyTemplates

Наборы данных в Pandas с помощью ProfileReport () | Python в LuckyTemplates

Один из наиболее частых вопросов, с которыми вы столкнетесь как аналитик данных, — это лучший способ изучить данный набор данных. Это важное соображение, прежде всего, если вы хотите объединить все данные в отчет, который будет легко интерпретировать вам или вашей команде. В этом уроке я собираюсь продемонстрировать, как вы можете эффективно исследовать наборы данных в Pandas, используя ProfileReport(). Вы можете посмотреть полное видео этого урока в нижней части этого блога.

Когда вы получаете набор данных, что вы делаете? Как вы исследуете набор данных? В первую очередь, если вы хотите собрать все вместе в удобном для чтения отчете для себя, коллег и т. д., вам нужно учесть множество вещей.

Во-первых, вы думаете о том, какие это переменные, потому что это повлияет на то, как вы их анализируете и как вы к ним относитесь. Данные означают то, что дано. Итак, чего не хватает, так это тех данных, которых у нас нет. Другое дело — визуализировать эти отношения. Как они выглядят? Мы хотим использовать эту силу визуализации рано и часто.

Это множество взаимосвязанных сложных вопросов. Хорошо, что есть эта функция отчета о профилировании, которая даст нам эти ответы. Итак, давайте посмотрим на все это в Python.

Оглавление

Исследуйте наборы данных в Pandas, используя функцию ProfileReport()

Во-первых, мы собираемся загрузить набор данных.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates

Затем из pandas_profiling мы собираемся импортировать эту вещь, называемую отчетом о профиле. Теперь, если вы получите сообщение об ошибке, вам, вероятно, нужно установить его. Я использую Анаконду. Я предлагаю вам использовать это также. Давайте запустим это, а затем распечатаем.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates

Итак, вот оно. У нас есть Обзор . Это дает нам разбивку типов переменных. У нас есть статистика набора данных. Мы видим количество столбцов строки, так далее и тому подобное. Преимущество этого отчета в том, что он похож на универсальный магазин, а также выглядит очень красиво. У него очень привлекательная подача.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates

Мы прокручиваем здесь, и у нас есть Variables . Мы получаем визуализацию и можем переключать дополнительные сведения о переменной. У нас есть флажки, указывающие на вещи, которые могут быть немного необычными. У нас также есть эти оповещения и многие другие функции, которые предоставят нам дополнительную информацию. И это для каждой переменной.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates

Продолжая прокручивать вниз, мы найдем «Взаимодействия», где созданы точечные диаграммы для визуализации данных.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates

И затем у нас есть Correlations , которые резюмируют отношения.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates

Далее идут Missing Values , которые очень важны. Как видите, у нас есть некоторые пропущенные значения, и мы хотим знать, почему. Эти визуализации здесь предназначены, чтобы помочь нам сделать это. Мы можем щелкнуть по каждому изображению и проанализировать данные.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates

Наконец, у нас есть образец. Мы могли бы получить это многими способами, но все, что мы делаем, это просто печатаем первые несколько строк, что полезно знать.

наборы данных в Pandas с помощью ProfileReport () |  Python в LuckyTemplates


MultiIndex в Pandas для многоуровневых или иерархических данных
Как загрузить примеры наборов данных в Python
Python в LuckyTemplates: как установить и настроить

Заключение

Вот как вы исследуете наборы данных в Pandas, используя функцию ProfileReport(). Есть много способов нарезать данные. Подумайте обо всех комбинациях перестановок данных. Это не сможет сделать все за вас, но это действительно хорошее начало.

Когда мы исследуем данные, это действительно итеративный процесс. Не существует такой волшебной таблетки, которую мы могли бы захотеть. Однако ProfilerReport() действительно отличный инструмент. Мы получаем много информации и всего одну строчку кода. Это бесплатный инструмент, поэтому я надеюсь, что вы сможете использовать его в своей работе. Дайте нам знать, как вы это делаете.

Всего наилучшего!


Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Что такое self в Python: примеры из реального мира

Как сохранить и загрузить файл RDS в R

Как сохранить и загрузить файл RDS в R

Вы узнаете, как сохранять и загружать объекты из файла .rds в R. В этом блоге также рассказывается, как импортировать объекты из R в LuckyTemplates.

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

Новый взгляд на первые N рабочих дней — решение для языка кодирования DAX

В этом руководстве по языку программирования DAX вы узнаете, как использовать функцию GENERATE и как динамически изменять название меры.

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

Продемонстрируйте идеи с помощью метода многопоточных динамических визуализаций в LuckyTemplates

В этом учебном пособии рассказывается, как использовать технику многопоточных динамических визуализаций для создания аналитических сведений из динамических визуализаций данных в ваших отчетах.

Введение в фильтрацию контекста в LuckyTemplates

Введение в фильтрацию контекста в LuckyTemplates

В этой статье я пройдусь по контексту фильтра. Контекст фильтра — одна из основных тем, с которой должен ознакомиться любой пользователь LuckyTemplates.

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Лучшие советы по использованию приложений в онлайн-службе LuckyTemplates

Я хочу показать, как онлайн-служба LuckyTemplates Apps может помочь в управлении различными отчетами и аналитическими данными, созданными из различных источников.

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Анализ изменений маржи прибыли с течением времени — аналитика с LuckyTemplates и DAX

Узнайте, как рассчитать изменения вашей прибыли, используя такие методы, как разветвление показателей и объединение формул DAX в LuckyTemplates.

Идеи материализации кэшей данных в DAX Studio

Идеи материализации кэшей данных в DAX Studio

В этом руководстве будут обсуждаться идеи материализации кэшей данных и то, как они влияют на производительность DAX при предоставлении результатов.

Бизнес-отчетность с использованием LuckyTemplates

Бизнес-отчетность с использованием LuckyTemplates

Если вы все еще используете Excel до сих пор, то сейчас самое подходящее время, чтобы начать использовать LuckyTemplates для своих бизнес-отчетов.

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать

Что такое шлюз LuckyTemplates? Все, что тебе нужно знать