Hoe webscraping in Excel werkt: gegevens importeren van internet

Hoe webscraping in Excel werkt: gegevens importeren van internet

Veel mensen gebruiken Excel voor het loggen van gegevens of het uitvoeren van berekeningen. Maar een weinig bekende functie in Excel is de mogelijkheid om gegevens van internet te schrapen en in spreadsheets te trekken.

In dit artikel leert u hoe u de webscraping-functie van Excel gebruikt. U leert ook hoe die web-scrape-query's werken en hoe u ze kunt automatiseren.

Hoe webscraping in Excel werkt

U kunt "externe" gegevens ophalen vanuit Excel. Houd alleen rekening met de volgende vereisten:

  • Uw computer moet een actieve internetverbinding hebben.
  • De URL waaruit u gegevens haalt, moet een statische gegevenstabel op de pagina hebben.
  • Als u het bestand automatiseert, heeft de computer waarop het Excel-bestand wordt opgeslagen een actieve internetverbinding nodig.

Wanneer u webscraping instelt in Excel, maakt u een 'webquery'. Deze query gebruikt een web-URL om verbinding te maken met internet en de webpagina met gegevens van een webserver op te halen. Excel verwerkt de inkomende HTML en verwijdert tabellen die op die pagina aanwezig zijn. U krijgt de kans om de tabel of tabellen te selecteren die u in uw spreadsheet wilt vastleggen.

Een Excel-webquery maken

Gebruik de volgende stappen om tabelgegevens van elke webpagina naar Excel te halen. In dit voorbeeld worden weergegevens gebruikt, maar u kunt dit ook doen met beursgegevens en meer .

1. Open Excel en selecteer het menu Gegevens .

Hoe webscraping in Excel werkt: gegevens importeren van internet

2. In het lint onder het gedeelte Gegevens ophalen en transformeren selecteert u Van internet .

Hoe webscraping in Excel werkt: gegevens importeren van internet

3. Hierdoor wordt het venster Webquery geopend. Plak de URL naar de pagina met de gegevens in het URL -veld. Selecteer OK .

Hoe webscraping in Excel werkt: gegevens importeren van internet

4. Excel zal contact opnemen en de webinhoud ophalen. Selecteer elk tabelresultaat aan de linkerkant van het Navigator-venster om een ​​voorbeeld van de tabel in het rechterdeelvenster te zien.

Hoe webscraping in Excel werkt: gegevens importeren van internet

5. Wanneer u het tabelvoorbeeld ziet, wordt de tabel van de webpagina weergegeven met de gegevens die u wilt schrapen, selecteert u de knop Laden onder aan het venster.

Hoe webscraping in Excel werkt: gegevens importeren van internet

6. U ziet de gegevens uit de webpaginatabel in de eerste schil van het actieve Excel-spreadsheet verschijnen.

Hoe webscraping in Excel werkt: gegevens importeren van internet

Gefeliciteerd, u hebt met succes webpaginagegevens geschraapt met Excel!

Geavanceerde Excel-webqueryopties

Op de hierboven beschreven schermen ziet u enkele extra opties. Als u de webgegevens liever wilt schrapen en importeren naar een andere locatie in uw Excel-spreadsheet, selecteert u de vervolgkeuzepijl naast de knop Laden en selecteert u in plaats daarvan Laden naar .

Hoe webscraping in Excel werkt: gegevens importeren van internet

U ziet een venster Gegevens importeren geopend. Gebruik de opties in dit venster om de gegevens precies zo op te maken en te plaatsen als u wilt.

Opties hier zijn onder meer:

  • Standaard tafel
  • Draaitabelrapport
  • Draaigrafiek
  • Maak gewoon de verbinding, maar importeer de gegevens niet

U ziet ook een optie om de gegevens in een specifieke cel te plaatsen in plaats van standaard naar A1 te gaan.

Hoe webscraping in Excel werkt: gegevens importeren van internet

Als u de optie Geavanceerd selecteert in plaats van Basis op de URL-pagina, kunt u meer geavanceerde URL-informatie opgeven.

Hoe webscraping in Excel werkt: gegevens importeren van internet

Dit is handig als de pagina waarvan u gegevens laadt parameters bevat (meestal gevolgd door een "?"-teken) of speciale HTTP-headerverzoeken, zoals pagina's waarvoor JSON HTTP-headerverzoekparameters nodig zijn.

Met deze geavanceerde queryfuncties kunt u gegevens schrapen met Excel, zelfs van interactieve webpagina's die mogelijk geen statische URL hebben om bij de gegevens te komen.

Hoe u uw Excel-webquery kunt aanpassen

Nadat u het bovenstaande proces hebt gebruikt om de webquery te maken die de gegevens ophaalt, kunt u deze verder aanpassen.

Er zijn twee manieren om toegang te krijgen tot de webquery-editor. De eerste is om met de rechtermuisknop op een cel te klikken die de resultaten bevat, Tabel te selecteren en vervolgens Query bewerken te selecteren .

Hoe webscraping in Excel werkt: gegevens importeren van internet

Hierdoor wordt het venster Web Query Editor geopend. U kunt ook een willekeurige resultatencel selecteren en vervolgens het kleine bladpictogram rechts van de tabel selecteren in het vak Query's en verbindingen aan de rechterkant. Dit opent een voorbeeld van de tabelgegevens die je hebt gekozen. Selecteer de knop Bewerken onderaan dit venster.

Hoe webscraping in Excel werkt: gegevens importeren van internet

In het venster Webquery-editor kunt u precies aanpassen hoe de webquery gegevens ophaalt van de webpagina waarmee u verbinding maakt.

Hoe webscraping in Excel werkt: gegevens importeren van internet

Opties hier zijn onder meer:

  • De bron-URL wijzigen (selecteer Bron onder Toegepaste stappen).
  • Bewerken welke brontabel moet worden opgehaald voor de gegevens van deze Excel-tabel (Selecteer Navigatie onder Toegepaste stappen).
  • Wijzigen hoe Excel de gegevens opmaakt of transformeert voordat ze in het blad worden geplaatst (Selecteer Gewijzigd type onder Toegepaste stappen).

Dit betekent dat zelfs als u niet tevreden bent met hoe uw webquery oorspronkelijk werkt, u deze kunt aanpassen met behulp van het venster Web Query Editor.

Tabellen handmatig en automatisch vernieuwen

Wanneer u de nieuwste gegevens van externe webpaginatabellen in uw Excel-blad krijgt, heeft u een aantal opties.

U kunt handmatig vernieuwen door het blad te selecteren met de tabel die u wilt vernieuwen, het menu Gegevens te selecteren en Alles vernieuwen op het lint te selecteren.

Hoe webscraping in Excel werkt: gegevens importeren van internet

Hiermee worden alle tabellen in dat blad dat gegevens van een externe bron ophaalt eenmalig vernieuwd.

Een meer geautomatiseerde manier om dit te doen, is door vernieuwingen in te plannen. Selecteer hiervoor de vervolgkeuzepijl onder aan de knop Alles vernieuwen en selecteer Verbindingseigenschappen .

Hoe webscraping in Excel werkt: gegevens importeren van internet

Hierdoor wordt het venster Query-eigenschappen geopend. Selecteer het tabblad Gebruik en schakel Vernieuwen om de xx minuten in .

Hoe webscraping in Excel werkt: gegevens importeren van internet

Wijzig de tijdinstelling in de frequentie waarmee u tabellen in het blad wilt vernieuwen. Houd er rekening mee dat deze automatische verversing alleen plaatsvindt wanneer u het Excel-bestand geopend heeft. Anders worden de gegevens in het bestand niet vernieuwd.

Webscraping in Excel

De functie om gegevens van internet te schrapen met Excel is krachtig. U kunt deze functie gebruiken en automatiseren om realtime dashboards te maken die worden bijgewerkt met de nieuwste gegevens van internet. Voeg gegevenstabellen toe van verschillende websites die regelmatig worden bijgewerkt met informatie die u belangrijk vindt, en breng het allemaal in een centrale spreadsheet.

Vervolgens kunt u berekeningen, visuals en volledige dashboards in de spreadsheet maken op basis van die gegevens die zichzelf zullen bijwerken.

Tags: #HOW-TO

Gember 2.7.53.0

Gember 2.7.53.0

Ginger is een gratis spelling- en grammaticacontrole.

Blokken

Blokken

Blocks is een intellectueel spel voor leerlingen van de derde klas van de basisschool om hun detectie- en oogvaardigheden te oefenen en wordt door docenten opgenomen in het IT-onderwijsondersteuningsprogramma.

Prezi 6.26

Prezi 6.26

Prezi is een gratis applicatie waarmee u digitale presentaties kunt maken, zowel online als offline.

Mathway

Mathway

Mathway is een zeer nuttige app waarmee u al die wiskundige problemen kunt oplossen waarvoor een complexer hulpmiddel nodig is dan de ingebouwde rekenmachine van uw apparaat.

Adobe Presenter

Adobe Presenter

Adobe Presenter is e-Learning-software uitgegeven door Adobe Systems en beschikbaar op het Microsoft Windows-platform als een Microsoft PowerPoint-plug-in.

Toekan 2.3.0

Toekan 2.3.0

Toucan is een educatief technologieplatform. Hiermee kunt u een nieuwe taal leren terwijl u op gewone, alledaagse websites surft.

ENetViet 24.2

ENetViet 24.2

eNetViet is een applicatie die ouders helpt in contact te komen met de school waar hun kinderen studeren, zodat ze de huidige leersituatie van hun kind duidelijk kunnen begrijpen.

Duolingo

Duolingo

Duolingo - Leer gratis talen, of kortweg Duolingo, is een educatief programma waarmee je veel verschillende talen kunt leren en oefenen.

Snel typen

Snel typen

RapidTyping is een handige en gebruiksvriendelijke tool voor toetsenbordtraining waarmee u uw typsnelheid kunt verbeteren en spelfouten kunt verminderen. Met lessen georganiseerd voor veel verschillende niveaus, leert RapidTyping u hoe u kunt typen of bestaande vaardigheden kunt verbeteren.

MathType 7.4.10.53

MathType 7.4.10.53

MathType is interactieve vergelijkingssoftware van ontwikkelaar Design Science (Dessci), waarmee u wiskundige notaties kunt maken en annoteren voor tekstverwerking, presentaties, eLearning, enz. Deze editor wordt ook gebruikt voor het maken van TeX-, LaTeX- en MathML-documenten.