Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Многие люди используют Excel для регистрации данных или выполнения расчетов. Но одна малоизвестная функция Excel — это возможность собирать данные из Интернета и переносить их в электронные таблицы.

В этой статье вы узнаете, как использовать функцию веб-скрейпинга в Excel. Вы также узнаете, как работают эти веб-запросы и как их автоматизировать.

Как работает парсинг веб-страниц в Excel

Вы можете получить «внешние» данные изнутри Excel. Просто помните о следующих требованиях:

  • Ваш компьютер должен иметь активное подключение к Интернету.
  • URL-адрес, с которого вы извлекаете данные, должен иметь статическую таблицу данных, присутствующую на странице.
  • Если вы автоматизируете файл, компьютеру, на котором сохранен файл Excel, требуется активное подключение к Интернету.

Когда вы настраиваете просмотр веб-страниц в Excel, вы создаете «веб-запрос». Этот запрос использует веб-URL для подключения к Интернету и извлечения веб-страницы с данными с веб-сервера. Excel обрабатывает входящий HTML-код и удаляет таблицы, присутствующие на этой странице. У вас будет возможность выбрать таблицу или таблицы, которые вы хотите включить в свою электронную таблицу.

Как создать веб-запрос Excel

Выполните следующие действия, чтобы извлечь табличные данные с любой веб-страницы в Excel. В этом примере используются данные о погоде, но вы также можете сделать это с данными фондового рынка и другими данными .

1. Откройте Excel и выберите меню Данные .

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

2. На ленте в разделе « Получить и преобразовать данные » выберите « Из Интернета » .

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

3. Откроется окно веб-запроса. Вставьте URL-адрес страницы с данными в поле URL . Выберите ОК .

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

4. Excel вытянет веб-контент. Выберите каждый результат таблицы в левой части окна Navigator, чтобы увидеть предварительный просмотр таблицы на правой панели.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

5. Когда вы увидите, что предварительный просмотр таблицы отображает таблицу с веб-страницы с данными, которые вы хотите очистить, нажмите кнопку « Загрузить » в нижней части окна.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

6. Вы увидите, что данные из таблицы веб-страницы появятся в первой оболочке активной электронной таблицы Excel.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Поздравляем, вы успешно извлекли данные веб-страницы с помощью Excel!

Расширенные параметры веб-запроса Excel

Вы заметите несколько дополнительных опций на экранах, описанных выше. Если вы предпочитаете очищать и импортировать веб-данные в другое место в электронной таблице Excel, выберите стрелку раскрывающегося списка рядом с кнопкой « Загрузить » и вместо этого выберите «Загрузить в » .

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Вы увидите открытое окно Импорт данных. Используйте параметры в этом окне, чтобы отформатировать и разместить данные именно так, как вы хотите, чтобы они отображались.

Варианты здесь включают:

  • Стандартный стол
  • Отчет сводной таблицы
  • сводная диаграмма
  • Просто создайте соединение, но не импортируйте данные

Вы также увидите возможность разместить данные, начиная с определенной ячейки, а не по умолчанию с A1.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Если вы выберете параметр « Дополнительно », а не «Основной» на странице URL-адреса, вы сможете предоставить более подробную информацию об URL-адресе.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Это полезно, если страница, с которой вы загружаете данные, включает параметры (обычно за которыми следует символ «?») или специальные запросы заголовков HTTP, например страницы, требующие параметров запроса заголовка HTTP JSON.

Эти расширенные функции запросов позволяют очищать данные с помощью Excel даже с интерактивных веб-страниц, которые могут не иметь статического URL-адреса для получения данных.

Как настроить веб-запрос Excel

После использования описанного выше процесса для создания веб-запроса, извлекающего данные, вы можете настроить его дальше.

Существует два способа доступа к редактору веб-запросов. Первый — щелкнуть правой кнопкой мыши любую ячейку, содержащую результаты, выбрать « Таблица », а затем выбрать « Редактировать запрос » .

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Откроется окно редактора веб-запросов. Кроме того, вы можете выбрать любую ячейку результатов, а затем выбрать небольшой значок листа справа от таблицы в поле «Запросы и подключения» справа. Откроется предварительный просмотр выбранных вами данных таблицы. Нажмите кнопку « Изменить » в нижней части этого окна.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

В окне редактора веб-запросов вы можете точно настроить, как веб-запрос извлекает данные с веб-страницы, к которой вы подключаетесь.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Варианты здесь включают:

  • Изменение исходного URL-адреса (выберите « Источник» в разделе «Примененные шаги»).
  • Редактирование исходной таблицы для получения данных этой таблицы Excel (выберите « Навигация» в разделе «Примененные шаги»).
  • Изменение способа форматирования или преобразования данных в Excel перед размещением их на листе (выберите «Измененный тип» в разделе «Примененные шаги»).

Это означает, что даже если вас не устраивает исходная работа вашего веб-запроса, вы можете настроить его с помощью окна редактора веб-запросов.

Как обновить таблицы вручную и автоматически

При получении последних данных из таблиц удаленных веб-страниц на лист Excel у вас есть несколько вариантов.

Вы можете обновить вручную , выбрав лист с таблицей, которую вы хотите обновить, выбрав меню « Данные » и выбрав « Обновить все » на ленте.

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Это выполнит однократное обновление всех таблиц на этом листе, которое извлекает данные из внешнего источника.

Более автоматизированный способ сделать это — запланировать обновления. Для этого выберите стрелку раскрывающегося списка в нижней части кнопки « Обновить все » и выберите « Свойства подключения » .

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Это откроет окно свойств запроса. Выберите вкладку « Использование » и включите « Обновлять каждые xx минут » .

Как работает парсинг веб-страниц в Excel: импорт данных из Интернета

Измените настройку времени на частоту обновления таблиц на листе. Имейте в виду, что это автоматическое обновление происходит только тогда, когда у вас открыт файл Excel. В противном случае он не обновляет данные внутри файла.

Веб-парсинг в Excel

Функция очистки данных из Интернета с помощью Excel является мощной. Вы можете использовать эту функцию и автоматизировать ее для создания информационных панелей в режиме реального времени, которые обновляются последними данными из Интернета. Внесите таблицы данных с нескольких веб-сайтов, которые часто обновляются с важной для вас информацией, и соберите все это в центральную электронную таблицу.

Затем вы можете создавать расчеты, визуальные эффекты и полностью информационные панели в электронной таблице на основе этих данных, которые будут обновляться.

Tags: #HOW-TO

Имбирь 2.7.53.0

Имбирь 2.7.53.0

Ginger — бесплатная программа для проверки орфографии и грамматики.

Блоки

Блоки

Blocks — это интеллектуальная игра для учащихся 3-го класса начальной школы, позволяющая тренировать навыки обнаружения и зрения. Учителя включили ее в программу поддержки преподавания информационных технологий.

Прези 6.26

Прези 6.26

Prezi — бесплатное приложение, позволяющее создавать цифровые презентации как онлайн, так и офлайн.

Матвей

Матвей

Mathway — очень полезное приложение, которое поможет вам решить все математические задачи, требующие более сложного инструмента, чем встроенный калькулятор вашего устройства.

Adobe Презентер

Adobe Презентер

Adobe Presenter — это программное обеспечение для электронного обучения, выпущенное Adobe Systems, доступное на платформе Microsoft Windows в виде подключаемого модуля Microsoft PowerPoint.

Тукан 2.3.0

Тукан 2.3.0

Toucan — образовательная технологическая платформа. Это позволяет вам изучать новый язык, просматривая обычные повседневные веб-сайты.

ENetВьет 24.2

ENetВьет 24.2

eNetViet — это приложение, которое помогает родителям связаться со школой, в которой учатся их дети, чтобы они могли четко понимать текущую ситуацию с обучением своего ребенка.

Дуолинго

Дуолинго

Duolingo — Изучайте языки бесплатно, или просто Duolingo, — это образовательная программа, позволяющая изучать и практиковать множество разных языков.

RapidTyping

RapidTyping

RapidTyping — это удобный и простой в использовании инструмент для тренировки клавиатуры, который поможет вам улучшить скорость набора текста и уменьшить количество ошибок в правописании. Благодаря урокам, организованным для разных уровней, RapidTyping научит вас печатать или улучшить имеющиеся навыки.

МатТип 7.4.10.53

МатТип 7.4.10.53

MathType — это интерактивное программное обеспечение для уравнений от разработчика Design Science (Dessci), которое позволяет создавать и комментировать математические обозначения для обработки текста, презентаций, электронного обучения и т. д. Этот редактор также используется для создания документов TeX, LaTeX и MathML.