Mucha gente usa Excel para registrar datos o realizar cálculos. Pero una característica poco conocida de Excel es la capacidad de extraer datos de Internet y colocarlos en hojas de cálculo.
En este artículo, aprenderá a usar la función de raspado web de Excel. También aprenderá cómo funcionan esas consultas de raspado web y cómo automatizarlas.
Cómo funciona Web Scraping en Excel
Puede obtener datos "externos" desde el interior de Excel. Solo ten en cuenta los siguientes requisitos:
- Su computadora debe tener una conexión a Internet activa.
- La URL de la que está extrayendo datos debe tener una tabla de datos estáticos presente en la página.
- Si automatiza el archivo, la computadora donde se guarda el archivo de Excel necesita una conexión a Internet activa.
Cuando configura el raspado web en Excel, está creando una "consulta web". Esta consulta utiliza una URL web para conectarse a Internet y extraer la página web con datos de un servidor web. Excel procesa el HTML entrante y elimina las tablas que están presentes en esa página. Tendrá la oportunidad de seleccionar la tabla o tablas que desea capturar en su hoja de cálculo.
Cómo crear una consulta web de Excel
Use los siguientes pasos para extraer datos de tablas de cualquier página web a Excel. Este ejemplo utiliza datos meteorológicos, pero también podría hacerlo con datos del mercado de valores y más .
1. Abra Excel y seleccione el menú Datos .

2. En la cinta debajo de la sección Obtener y transformar datos , seleccione Desde la web .

3. Esto abrirá la ventana Consulta web. Pegue la URL de la página con los datos en el campo URL . Seleccione Aceptar .

4. Excel se acercará y extraerá el contenido web. Seleccione cada resultado de la tabla a la izquierda de la ventana Navegador para ver una vista previa de la tabla en el panel derecho.

5. Cuando vea la vista previa de la tabla, muestre la tabla de la página web con los datos que desea extraer, seleccione el botón Cargar en la parte inferior de la ventana.

6. Verá que los datos de la tabla de la página web aparecen en el primer caparazón de la hoja de cálculo de Excel activa.

¡Felicitaciones, ha raspado con éxito los datos de la página web con Excel!
Opciones avanzadas de consulta web de Excel
Notará algunas opciones adicionales en las pantallas descritas anteriormente. Si prefiere raspar e importar los datos web a una ubicación diferente en su hoja de cálculo de Excel, seleccione la flecha desplegable junto al botón Cargar y, en su lugar, seleccione Cargar en .

Verá que se abre una ventana Importar datos. Utilice las opciones de esta ventana para formatear y colocar los datos exactamente como le gustaría que aparecieran.
Las opciones aquí incluyen:
- Mesa estándar
- Informe de tabla dinámica
- Gráfico dinámico
- Simplemente cree la conexión pero no importe los datos.
También verá una opción para colocar los datos comenzando en una celda específica en lugar de A1 por defecto.

Si selecciona la opción Avanzado en lugar de Básico en la página de URL, puede proporcionar información de URL más avanzada.

Esto es útil si la página desde la que está cargando datos incluye parámetros (generalmente seguidos de un carácter "?") o solicitudes de encabezado HTTP especiales, como páginas que requieren parámetros de solicitud de encabezado HTTP JSON.
Estas funciones de consulta avanzadas le permiten recopilar datos con Excel, incluso de páginas web interactivas que pueden no tener una URL estática para obtener los datos.
Cómo personalizar su consulta web de Excel
Después de usar el proceso anterior para crear la consulta web que extrae los datos, puede personalizarla aún más.
Hay dos formas de acceder al Editor de consultas web. La primera es hacer clic con el botón derecho en cualquier celda que contenga los resultados, seleccionar Tabla y luego Editar consulta .

Esto abrirá la ventana del Editor de consultas web. Alternativamente, puede seleccionar cualquier celda de resultados y luego seleccionar el icono de hoja pequeña a la derecha de la tabla en el cuadro Consultas y conexiones a la derecha. Esto abrirá una vista previa de los datos de la tabla que ha elegido. Seleccione el botón Editar en la parte inferior de esta ventana.

En la ventana del Editor de consultas web, puede personalizar profundamente cómo la consulta web extrae datos de la página web a la que se está conectando.

Las opciones aquí incluyen:
- Modificar la URL de origen (seleccione Origen en Pasos aplicados).
- Editar qué tabla de origen extraer para los datos de esta tabla de Excel (Seleccione Navegación en Pasos aplicados).
- Alterar cómo Excel formatea o transforma los datos antes de colocarlos en la hoja (Seleccione Tipo modificado en Pasos aplicados).
Esto significa que incluso si no está satisfecho con el funcionamiento original de su consulta web, puede personalizarla mediante la ventana Editor de consultas web.
Cómo actualizar tablas de forma manual y automática
Al obtener los datos más recientes de tablas de páginas web remotas en su hoja de Excel, tiene un par de opciones.
Puede actualizar manualmente seleccionando la hoja con la tabla que desea actualizar, seleccionando el menú Datos y seleccionando Actualizar todo en la cinta.

Esto realizará una actualización única de todas las tablas en esa hoja que recupera datos de una fuente externa.
Una forma más automatizada de hacer esto es programar actualizaciones. Para hacer esto, seleccione la flecha desplegable en la parte inferior del botón Actualizar todo y seleccione Propiedades de conexión .

Esto abrirá la ventana Propiedades de consulta. Seleccione la pestaña Uso y habilite Actualizar cada xx minutos .

Cambie la configuración de tiempo a la frecuencia con la que desea que se actualicen las tablas de la hoja. Tenga en cuenta que esta actualización automática solo ocurre cuando tiene abierto el archivo de Excel. De lo contrario, no actualiza los datos dentro del archivo.
Web Scraping en Excel
La función para extraer datos de la web con Excel es poderosa. Puede usar esta función y automatizarla para crear paneles en tiempo real que se actualicen con los datos más recientes de toda la web. Incorpore tablas de datos de varios sitios web que se actualicen con frecuencia con la información que le interesa y llévelo todo a una hoja de cálculo central.
Luego, puede crear cálculos, imágenes y tableros completos en la hoja de cálculo en función de esos datos que se actualizarán solos.