Cómo funciona Web Scraping en Excel: importar datos desde la Web

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Mucha gente usa Excel para registrar datos o realizar cálculos. Pero una característica poco conocida de Excel es la capacidad de extraer datos de Internet y colocarlos en hojas de cálculo.

En este artículo, aprenderá a usar la función de raspado web de Excel. También aprenderá cómo funcionan esas consultas de raspado web y cómo automatizarlas.

Cómo funciona Web Scraping en Excel

Puede obtener datos "externos" desde el interior de Excel. Solo ten en cuenta los siguientes requisitos:

  • Su computadora debe tener una conexión a Internet activa.
  • La URL de la que está extrayendo datos debe tener una tabla de datos estáticos presente en la página.
  • Si automatiza el archivo, la computadora donde se guarda el archivo de Excel necesita una conexión a Internet activa.

Cuando configura el raspado web en Excel, está creando una "consulta web". Esta consulta utiliza una URL web para conectarse a Internet y extraer la página web con datos de un servidor web. Excel procesa el HTML entrante y elimina las tablas que están presentes en esa página. Tendrá la oportunidad de seleccionar la tabla o tablas que desea capturar en su hoja de cálculo.

Cómo crear una consulta web de Excel

Use los siguientes pasos para extraer datos de tablas de cualquier página web a Excel. Este ejemplo utiliza datos meteorológicos, pero también podría hacerlo con datos del mercado de valores y más .

1. Abra Excel y seleccione el menú Datos .

Cómo funciona Web Scraping en Excel: importar datos desde la Web

2. En la cinta debajo de la sección Obtener y transformar datos , seleccione Desde la web .

Cómo funciona Web Scraping en Excel: importar datos desde la Web

3. Esto abrirá la ventana Consulta web. Pegue la URL de la página con los datos en el campo URL . Seleccione Aceptar .

Cómo funciona Web Scraping en Excel: importar datos desde la Web

4. Excel se acercará y extraerá el contenido web. Seleccione cada resultado de la tabla a la izquierda de la ventana Navegador para ver una vista previa de la tabla en el panel derecho.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

5. Cuando vea la vista previa de la tabla, muestre la tabla de la página web con los datos que desea extraer, seleccione el botón Cargar en la parte inferior de la ventana.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

6. Verá que los datos de la tabla de la página web aparecen en el primer caparazón de la hoja de cálculo de Excel activa.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

¡Felicitaciones, ha raspado con éxito los datos de la página web con Excel!

Opciones avanzadas de consulta web de Excel

Notará algunas opciones adicionales en las pantallas descritas anteriormente. Si prefiere raspar e importar los datos web a una ubicación diferente en su hoja de cálculo de Excel, seleccione la flecha desplegable junto al botón Cargar y, en su lugar, seleccione Cargar en .

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Verá que se abre una ventana Importar datos. Utilice las opciones de esta ventana para formatear y colocar los datos exactamente como le gustaría que aparecieran.

Las opciones aquí incluyen:

  • Mesa estándar
  • Informe de tabla dinámica
  • Gráfico dinámico
  • Simplemente cree la conexión pero no importe los datos.

También verá una opción para colocar los datos comenzando en una celda específica en lugar de A1 por defecto.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Si selecciona la opción Avanzado en lugar de Básico en la página de URL, puede proporcionar información de URL más avanzada.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Esto es útil si la página desde la que está cargando datos incluye parámetros (generalmente seguidos de un carácter "?") o solicitudes de encabezado HTTP especiales, como páginas que requieren parámetros de solicitud de encabezado HTTP JSON.

Estas funciones de consulta avanzadas le permiten recopilar datos con Excel, incluso de páginas web interactivas que pueden no tener una URL estática para obtener los datos.

Cómo personalizar su consulta web de Excel

Después de usar el proceso anterior para crear la consulta web que extrae los datos, puede personalizarla aún más.

Hay dos formas de acceder al Editor de consultas web. La primera es hacer clic con el botón derecho en cualquier celda que contenga los resultados, seleccionar Tabla y luego Editar consulta .

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Esto abrirá la ventana del Editor de consultas web. Alternativamente, puede seleccionar cualquier celda de resultados y luego seleccionar el icono de hoja pequeña a la derecha de la tabla en el cuadro Consultas y conexiones a la derecha. Esto abrirá una vista previa de los datos de la tabla que ha elegido. Seleccione el botón Editar en la parte inferior de esta ventana.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

En la ventana del Editor de consultas web, puede personalizar profundamente cómo la consulta web extrae datos de la página web a la que se está conectando.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Las opciones aquí incluyen:

  • Modificar la URL de origen (seleccione Origen en Pasos aplicados).
  • Editar qué tabla de origen extraer para los datos de esta tabla de Excel (Seleccione Navegación en Pasos aplicados).
  • Alterar cómo Excel formatea o transforma los datos antes de colocarlos en la hoja (Seleccione Tipo modificado en Pasos aplicados).

Esto significa que incluso si no está satisfecho con el funcionamiento original de su consulta web, puede personalizarla mediante la ventana Editor de consultas web.

Cómo actualizar tablas de forma manual y automática

Al obtener los datos más recientes de tablas de páginas web remotas en su hoja de Excel, tiene un par de opciones.

Puede actualizar manualmente seleccionando la hoja con la tabla que desea actualizar, seleccionando el menú Datos y seleccionando Actualizar todo en la cinta.

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Esto realizará una actualización única de todas las tablas en esa hoja que recupera datos de una fuente externa.

Una forma más automatizada de hacer esto es programar actualizaciones. Para hacer esto, seleccione la flecha desplegable en la parte inferior del botón Actualizar todo y seleccione Propiedades de conexión .

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Esto abrirá la ventana Propiedades de consulta. Seleccione la pestaña Uso y habilite Actualizar cada xx minutos .

Cómo funciona Web Scraping en Excel: importar datos desde la Web

Cambie la configuración de tiempo a la frecuencia con la que desea que se actualicen las tablas de la hoja. Tenga en cuenta que esta actualización automática solo ocurre cuando tiene abierto el archivo de Excel. De lo contrario, no actualiza los datos dentro del archivo.

Web Scraping en Excel

La función para extraer datos de la web con Excel es poderosa. Puede usar esta función y automatizarla para crear paneles en tiempo real que se actualicen con los datos más recientes de toda la web. Incorpore tablas de datos de varios sitios web que se actualicen con frecuencia con la información que le interesa y llévelo todo a una hoja de cálculo central.

Luego, puede crear cálculos, imágenes y tableros completos en la hoja de cálculo en función de esos datos que se actualizarán solos.

Tags: #HOW-TO

Jengibre 2.7.53.0

Jengibre 2.7.53.0

Ginger es un corrector ortográfico y gramatical gratuito.

Bloques

Bloques

Blocks es un juego intelectual para que los alumnos de 3º de primaria practiquen sus habilidades de detección y visión y está incluido por los profesores en el programa de apoyo a la enseñanza de TI.

Prezi 6.26

Prezi 6.26

Prezi es una aplicación gratuita que te permite crear presentaciones digitales, tanto online como offline.

Matemáticas

Matemáticas

Mathway es una aplicación muy útil que puede ayudarte a resolver todos aquellos problemas matemáticos que requieren una herramienta más compleja que la calculadora integrada en tu dispositivo.

Presentador de Adobe

Presentador de Adobe

Adobe Presenter es un software de aprendizaje electrónico lanzado por Adobe Systems y disponible en la plataforma Microsoft Windows como un complemento de Microsoft PowerPoint.

Tucán 2.3.0

Tucán 2.3.0

Toucan es una plataforma tecnológica educativa. Le permite aprender un nuevo idioma mientras navega por sitios web comunes y cotidianos.

ESetViet 24.2

ESetViet 24.2

eNetViet es una aplicación que ayuda a conectar a los padres con la escuela donde estudian sus hijos para que puedan comprender claramente la situación de aprendizaje actual de sus hijos.

Duolingo

Duolingo

Duolingo - Aprende Idiomas Gratis, o simplemente Duolingo, es un programa educativo que te permite aprender y practicar muchos idiomas diferentes.

Escritura rápida

Escritura rápida

RapidTyping es una herramienta de entrenamiento de teclado conveniente y fácil de usar que lo ayudará a mejorar su velocidad de escritura y reducir los errores ortográficos. Con lecciones organizadas para muchos niveles diferentes, RapidTyping le enseñará cómo escribir o mejorar sus habilidades existentes.

Matemáticas 7.4.10.53

Matemáticas 7.4.10.53

MathType es un software de ecuaciones interactivas del desarrollador Design Science (Dessci), que le permite crear y anotar notaciones matemáticas para procesamiento de textos, presentaciones, aprendizaje electrónico, etc. Este editor también se utiliza para crear documentos TeX, LaTeX y MathML.