Excel 中 Web 抓取的工作原理:從 Web 導入數據

Excel 中 Web 抓取的工作原理:從 Web 導入數據

許多人使用 Excel 來記錄數據或執行計算。但 Excel 中一個鮮為人知的功能是能夠從互聯網上抓取數據並將其拉入電子表格。

在本文中,您將學習如何使用 Excel 的網絡抓取功能。您還將了解這些網絡抓取查詢是如何工作的以及如何使它們自動化。

Excel 中的網頁抓取如何工作

您可以從 Excel 內部獲取“外部”數據。請記住以下要求:

  • 您的計算機必須具有有效的 Internet 連接。
  • 您從中提取數據的 URL 需要在頁面上顯示靜態數據表。
  • 如果您自動執行文件,則保存 Excel 文件的計算機需要有效的 Internet 連接。

在 Excel 中設置網頁抓取時,您正在創建“網頁查詢”。此查詢使用 Web URL 連接到 Internet 並從 Web 服務器中提取包含數據的網頁。Excel 處理傳入的 HTML 並刪除該頁面上存在的表格。您將有機會選擇要在電子表格中捕獲的一個或多個表格。

如何創建 Excel Web 查詢

使用以下步驟將表格數據從任何網頁提取到 Excel。此示例使用天氣數據,但您也可以使用股票市場數據等來執行此操作。

1. 打開 Excel 並選擇數據菜單。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

2. 在Get & Transform Data部分下的功能區中,選擇From Web

Excel 中 Web 抓取的工作原理:從 Web 導入數據

3. 這將打開 Web 查詢窗口。將帶有數據的頁面的 URL 粘貼到URL字段中。選擇確定

Excel 中 Web 抓取的工作原理:從 Web 導入數據

4. Excel 會伸出手來拉取網頁內容。選擇導航器窗口左側的每個表格結果,以在右側窗格中查看表格的預覽。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

5. 當您看到表格預覽顯示來自網頁的表格以及您要抓取的數據時,選擇窗口底部的加載按鈕。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

6. 您將看到網頁表格中的數據出現在活動 Excel 電子表格的第一個外殼中。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

恭喜,您已成功使用 Excel 抓取網頁數據!

高級 Excel Web 查詢選項

您會注意到上述屏幕上的一些附加選項。如果您希望將 Web 數據抓取並導入 Excel 電子表格中的其他位置,請選擇“加載”按鈕旁邊的下拉箭頭,然後選擇“加載到”

Excel 中 Web 抓取的工作原理:從 Web 導入數據

您將看到一個導入數據窗口打開。使用此窗口中的選項以完全按照您希望的方式格式化和放置數據。

這裡的選項包括:

  • 標準桌
  • 數據透視表
  • 數據透視圖
  • 只需創建連接但不要導入數據

您還將看到一個選項,可以將數據從特定單元格開始放置,而不是默認為 A1。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

如果在 URL 頁面上選擇Advanced選項而不是 Basic,則可以提供更高級的 URL 信息。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

如果您從中加載數據的頁麵包含參數(通常後跟“?”字符)或特殊的 HTTP 標頭請求(例如需要 JSON HTTP 標頭請求參數的頁面),這將非常有用。

這些高級查詢功能讓您可以使用 Excel 抓取數據,甚至可以從可能沒有靜態 URL 來獲取數據的交互式網頁中抓取數據。

如何自定義 Excel Web 查詢

在使用上述過程創建提取數據的 Web 查詢後,您可以進一步對其進行自定義。

有兩種方法可以訪問 Web 查詢編輯器。第一種是右鍵單擊包含結果的任何單元格,選擇Table,然後選擇Edit Query

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這將打開 Web 查詢編輯器窗口。或者,您可以選擇任何結果單元格,然後在右側的“查詢和連接”框中選擇表格右側的小工作表圖標。這將打開您選擇的表格數據的預覽。選擇此窗口底部的編輯按鈕。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

在 Web Query Editor 窗口中,您可以深入自定義 Web 查詢如何從您正在連接的網頁中提取數據。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這裡的選項包括:

  • 修改源 URL(在 Applied Steps 下選擇Source )。
  • 編輯要為此 Excel 表的數據提取的源表(選擇應用步驟下的導航)。
  • 在將數據放入工作表之前更改 Excel 格式化或轉換數據的方式(在應用的步驟下選擇更改的類型)。

這意味著即使您對 Web 查詢最初的工作方式不滿意,您也可以使用 Web 查詢編輯器窗口對其進行自定義。

如何手動和自動刷新表

從遠程網頁表中獲取最新數據到 Excel 工作表中時,您有幾個選擇。

您可以通過選擇包含要刷新的表的工作表、選擇“數據”菜單並從功能區中選擇“全部刷新”來手動刷新。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這將對從外部源檢索數據的工作表中的所有表執行一次刷新。

一種更自動化的方法是安排刷新。為此,請選擇Refresh All按鈕底部的下拉箭頭,然後選擇Connection Properties

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這將打開查詢屬性窗口。選擇Usage選項卡,然後啟用Refresh every xx minutes

Excel 中 Web 抓取的工作原理:從 Web 導入數據

將時間設置更改為您希望工作表中的表格刷新的頻率。請記住,此自動刷新僅在您打開 Excel 文件時發生。否則它不會刷新文件內的數據。

Excel 中的網頁抓取

使用 Excel 從 Web 上抓取數據的功能非常強大。您可以使用此功能並使其自動化來創建實時儀表板,這些儀表板會使用來自網絡的最新數據進行更新。從多個網站引入數據表,這些數據表經常更新您關心的信息,並將其全部放入中央電子表格。

然後,您可以根據將自行更新的數據在電子表格中創建計算、視覺效果和完整的儀表板。

Tags: #HOW-TO

生薑2.7.53.0

生薑2.7.53.0

Ginger 是一款免費的拼字和文法檢查器。

積木

積木

Blocks 是一款供三年級小學生練習檢測和眼力技能的智力遊戲,被教師納入 IT 教學支援計劃。

普雷茲 6.26

普雷茲 6.26

Prezi 是一款免費應用程序,可讓您在線上和離線建立數位簡報。

數學之路

數學之路

Mathway 是一款非常有用的應用程序,可協助您解決所有需要比裝置內建計算器更複雜的工具的數學問題。

Adobe 示範者

Adobe 示範者

Adobe Presenter 是 Adob​​e Systems 發佈的電子學習軟體,可在 Microsoft Windows 平台上作為 Microsoft PowerPoint 外掛程式使用。

巨嘴鳥2.3.0

巨嘴鳥2.3.0

Toucan 是一個教育科技平台。它允許您在瀏覽常見的日常網站時學習新語言。

ENetViet 24.2

ENetViet 24.2

eNetViet 是一款幫助家長與孩子就讀的學校建立聯繫的應用程序,以便他們可以清楚地了解孩子當前的學習情況。

多鄰國

多鄰國

Duolingo - 免費學習語言,或簡稱 Duolingo,是一個教育程序,可讓您學習和練習許多不同的語言。

快速打字

快速打字

RapidTyping 是一款方便易用的鍵盤訓練工具,可協助您提高打字速度並減少拼字錯誤。透過針對許多不同級別組織的課程,RapidTyping 將教您如何打字或提高現有技能。

數學類型7.4.10.53

數學類型7.4.10.53

MathType 是來自開發人員 Design Science (Dessci) 的互動式方程式軟體,它允許您為文字處理、演示、電子學習等創建和註釋數學符號。該編輯器還用於創建 TeX、LaTeX 和 MathML 文件。