Excel 中 Web 抓取的工作原理:從 Web 導入數據

Excel 中 Web 抓取的工作原理:從 Web 導入數據

許多人使用 Excel 來記錄數據或執行計算。但 Excel 中一個鮮為人知的功能是能夠從互聯網上抓取數據並將其拉入電子表格。

在本文中,您將學習如何使用 Excel 的網絡抓取功能。您還將了解這些網絡抓取查詢是如何工作的以及如何使它們自動化。

Excel 中的網頁抓取如何工作

您可以從 Excel 內部獲取“外部”數據。請記住以下要求:

  • 您的計算機必須具有有效的 Internet 連接。
  • 您從中提取數據的 URL 需要在頁面上顯示靜態數據表。
  • 如果您自動執行文件,則保存 Excel 文件的計算機需要有效的 Internet 連接。

在 Excel 中設置網頁抓取時,您正在創建“網頁查詢”。此查詢使用 Web URL 連接到 Internet 並從 Web 服務器中提取包含數據的網頁。Excel 處理傳入的 HTML 並刪除該頁面上存在的表格。您將有機會選擇要在電子表格中捕獲的一個或多個表格。

如何創建 Excel Web 查詢

使用以下步驟將表格數據從任何網頁提取到 Excel。此示例使用天氣數據,但您也可以使用股票市場數據等來執行此操作。

1. 打開 Excel 並選擇數據菜單。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

2. 在Get & Transform Data部分下的功能區中,選擇From Web

Excel 中 Web 抓取的工作原理:從 Web 導入數據

3. 這將打開 Web 查詢窗口。將帶有數據的頁面的 URL 粘貼到URL字段中。選擇確定

Excel 中 Web 抓取的工作原理:從 Web 導入數據

4. Excel 會伸出手來拉取網頁內容。選擇導航器窗口左側的每個表格結果,以在右側窗格中查看表格的預覽。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

5. 當您看到表格預覽顯示來自網頁的表格以及您要抓取的數據時,選擇窗口底部的加載按鈕。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

6. 您將看到網頁表格中的數據出現在活動 Excel 電子表格的第一個外殼中。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

恭喜,您已成功使用 Excel 抓取網頁數據!

高級 Excel Web 查詢選項

您會注意到上述屏幕上的一些附加選項。如果您希望將 Web 數據抓取並導入 Excel 電子表格中的其他位置,請選擇“加載”按鈕旁邊的下拉箭頭,然後選擇“加載到”

Excel 中 Web 抓取的工作原理:從 Web 導入數據

您將看到一個導入數據窗口打開。使用此窗口中的選項以完全按照您希望的方式格式化和放置數據。

這裡的選項包括:

  • 標準桌
  • 數據透視表
  • 數據透視圖
  • 只需創建連接但不要導入數據

您還將看到一個選項,可以將數據從特定單元格開始放置,而不是默認為 A1。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

如果在 URL 頁面上選擇Advanced選項而不是 Basic,則可以提供更高級的 URL 信息。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

如果您從中加載數據的頁麵包含參數(通常後跟“?”字符)或特殊的 HTTP 標頭請求(例如需要 JSON HTTP 標頭請求參數的頁面),這將非常有用。

這些高級查詢功能讓您可以使用 Excel 抓取數據,甚至可以從可能沒有靜態 URL 來獲取數據的交互式網頁中抓取數據。

如何自定義 Excel Web 查詢

在使用上述過程創建提取數據的 Web 查詢後,您可以進一步對其進行自定義。

有兩種方法可以訪問 Web 查詢編輯器。第一種是右鍵單擊包含結果的任何單元格,選擇Table,然後選擇Edit Query

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這將打開 Web 查詢編輯器窗口。或者,您可以選擇任何結果單元格,然後在右側的“查詢和連接”框中選擇表格右側的小工作表圖標。這將打開您選擇的表格數據的預覽。選擇此窗口底部的編輯按鈕。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

在 Web Query Editor 窗口中,您可以深入自定義 Web 查詢如何從您正在連接的網頁中提取數據。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這裡的選項包括:

  • 修改源 URL(在 Applied Steps 下選擇Source )。
  • 編輯要為此 Excel 表的數據提取的源表(選擇應用步驟下的導航)。
  • 在將數據放入工作表之前更改 Excel 格式化或轉換數據的方式(在應用的步驟下選擇更改的類型)。

這意味著即使您對 Web 查詢最初的工作方式不滿意,您也可以使用 Web 查詢編輯器窗口對其進行自定義。

如何手動和自動刷新表

從遠程網頁表中獲取最新數據到 Excel 工作表中時,您有幾個選擇。

您可以通過選擇包含要刷新的表的工作表、選擇“數據”菜單並從功能區中選擇“全部刷新”來手動刷新。

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這將對從外部源檢索數據的工作表中的所有表執行一次刷新。

一種更自動化的方法是安排刷新。為此,請選擇Refresh All按鈕底部的下拉箭頭,然後選擇Connection Properties

Excel 中 Web 抓取的工作原理:從 Web 導入數據

這將打開查詢屬性窗口。選擇Usage選項卡,然後啟用Refresh every xx minutes

Excel 中 Web 抓取的工作原理:從 Web 導入數據

將時間設置更改為您希望工作表中的表格刷新的頻率。請記住,此自動刷新僅在您打開 Excel 文件時發生。否則它不會刷新文件內的數據。

Excel 中的網頁抓取

使用 Excel 從 Web 上抓取數據的功能非常強大。您可以使用此功能並使其自動化來創建實時儀表板,這些儀表板會使用來自網絡的最新數據進行更新。從多個網站引入數據表,這些數據表經常更新您關心的信息,並將其全部放入中央電子表格。

然後,您可以根據將自行更新的數據在電子表格中創建計算、視覺效果和完整的儀表板。

Tags: #HOW-TO

[已更新] 如何修復 Windows 10 更新錯誤 0x80244022

[已更新] 如何修復 Windows 10 更新錯誤 0x80244022

為了解決 Windows 10 更新錯誤 0x80244022,請參考有效的解決方案,例如運行疑難解答、檢查網絡設定等。

如何在 Discord 上播放 Disney+

如何在 Discord 上播放 Disney+

唯一比觀看 Disney+ 更好的是和朋友一起觀看。通過本指南了解如何在 Discord 上流式傳輸 Disney+。

已修復:Hamachi 無法在 Windows 10 和 11 上獲取適配器配置

已修復:Hamachi 無法在 Windows 10 和 11 上獲取適配器配置

閱讀完整指南以了解如何解決 Windows 10 和 11 上的 Hamachi 無法獲取適配器配置錯誤,解決方案包括更新驅動程序、防火牆設置等

修復 REGISTRY_ERROR 藍屏錯誤 (0x00000051) 的 7 個工作解決方案

修復 REGISTRY_ERROR 藍屏錯誤 (0x00000051) 的 7 個工作解決方案

了解修復 REGISTRY_ERROR 藍屏錯誤 (0x00000051) 的有效方法,解決 Windows 系統中遇到的註冊表錯誤。

如何在 Roku 上更改音量

如何在 Roku 上更改音量

在 Roku 上調整聲音比使用遙控器向上或向下移動更多。以下是如何在 Roku 上更改音量的完整指南。

如何修復 Roblox 錯誤代碼 267 [7 簡單修復]

如何修復 Roblox 錯誤代碼 267 [7 簡單修復]

在 Roblox 中被禁止或踢出遊戲的錯誤代碼 267,按照以下簡單解決方案輕鬆解決...

[已解決] 如何解決 Rust 不斷崩潰的問題?

[已解決] 如何解決 Rust 不斷崩潰的問題?

面對 Rust 在啟動或加載時不斷崩潰,然後按照給出的修復並輕鬆停止 Rust 崩潰問題...

[已修復] 驅動程序 WudfRd 在 Windows 10 中無法加載錯誤 219

[已修復] 驅動程序 WudfRd 在 Windows 10 中無法加載錯誤 219

如果在 Windows 10 中遇到 Driver WudfRd failed to load 錯誤,事件 ID 為 219,請遵循此處給出的修復並有效解決錯誤 219。

如何修復“未知軟件異常(0xe0434352)”?

如何修復“未知軟件異常(0xe0434352)”?

發現修復此處給出的 Windows 10 和 11 上的未知軟件異常 (0xe0434352) 錯誤的可能解決方案

[已解決] Grand Theft Auto V 中的“Script Hook V 嚴重錯誤”

[已解決] Grand Theft Auto V 中的“Script Hook V 嚴重錯誤”

想知道如何修復 GTA 5 中的腳本掛鉤 V 嚴重錯誤,然後按照更新腳本掛鉤應用程序等修復,重新安裝 GTA 5 和其他