Excel での Web スクレイピングのしくみ: Web からデータをインポートする

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

多くの人が、データの記録や計算の実行に Excel を使用しています。しかし、あまり知られていない Excel の機能の 1 つは、インターネットからデータをスクレイピングしてスプレッドシートに取り込む機能です。

この記事では、Excel の Web スクレイピング機能の使用方法を学習します。また、これらの Web スクレイプ クエリがどのように機能するか、およびそれらを自動化する方法についても学習します。

Excel での Web スクレイピングのしくみ

Excel内から「外部」データを取得できます。次の要件に注意してください。

  • コンピューターにはアクティブなインターネット接続が必要です。
  • データを取得する URL には、ページに静的データ テーブルが存在する必要があります。
  • ファイルを自動化する場合、Excel ファイルが保存されているコンピューターにはアクティブなインターネット接続が必要です。

Excel で Web スクレイピングを設定すると、「Web クエリ」が作成されます。このクエリは、Web URL を使用してインターネットに接続し、Web サーバーからデータを含む Web ページを取得します。Excel は受信した HTML を処理し、そのページにあるテーブルを削除します。スプレッドシートにキャプチャするテーブルを選択する機会があります。

Excel Web クエリを作成する方法

次の手順を使用して、任意の Web ページからテーブル データを Excel に取り込みます。この例では気象データを使用していますが、株式市場データなどを使用してこれを行うこともできます。

1. Excel を開き、[データ] メニューを選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

2. リボンの[データの取得と変換]セクションで、[ Web から]を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

3. これにより、Web クエリ ウィンドウが開きます。データを含むページの URL をURLフィールドに貼り付けます。[ OK]を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

4. Excel が到達し、Web コンテンツを取得します。ナビゲーター ウィンドウの左側にある各テーブルの結果を選択すると、右側のペインにテーブルのプレビューが表示されます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

5. スクレイピングするデータを含む Web ページのテーブルがテーブル プレビューに表示されたら、ウィンドウの下部にある[読み込み] ボタンを選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

6. Web ページ テーブルのデータが、アクティブな Excel スプレッドシートの最初のシェルに表示されます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

おめでとうございます。Excel で Web ページのデータをスクレイピングすることに成功しました。

高度な Excel Web クエリ オプション

上記の画面には、いくつかの追加オプションがあります。Web データをスクレイピングして Excel スプレッドシートの別の場所にインポートする場合は、[読み込み] ボタンの横にあるドロップダウン矢印を選択し、代わりに [読み込み先] を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

[データのインポート] ウィンドウが開きます。このウィンドウのオプションを使用して、データを希望どおりにフォーマットして配置します。

ここでのオプションは次のとおりです。

  • 標準テーブル
  • ピボットテーブル レポート
  • ピボットグラフ
  • 接続を作成するだけで、データをインポートしない

デフォルトの A1 ではなく、特定のセルから始まるデータを配置するオプションも表示されます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

URL ページで [基本] ではなく[詳細] オプションを選択すると、より詳細な URL 情報を提供できます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これは、データの読み込み元のページにパラメーター (通常は「?」文字が続く) や、JSON HTTP ヘッダー リクエスト パラメーターを必要とするページなどの特別な HTTP ヘッダー リクエストが含まれている場合に便利です。

これらの高度なクエリ機能を使用すると、データを取得するための静的 URL がないインタラクティブな Web ページからでも、Excel でデータをスクレイピングできます。

Excel Web クエリをカスタマイズする方法

上記のプロセスを使用してデータを取得する Web クエリを作成した後、さらにカスタマイズできます。

Web クエリ エディターにアクセスするには、2 つの方法があります。1 つ目は、結果を含む任意のセルを右クリックし、[テーブル] を選択してから、[クエリの編集]を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これにより、Web クエリ エディター ウィンドウが開きます。または、任意の結果セルを選択し、右側の [クエリと接続] ボックスでテーブルの右側にある小さなシート アイコンを選択することもできます。これにより、選択したテーブル データのプレビューが開きます。このウィンドウの下部にある[編集] ボタンを選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

Web クエリ エディター ウィンドウでは、接続先の Web ページから Web クエリがデータを取得する方法を詳細にカスタマイズできます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

ここでのオプションは次のとおりです。

  • ソース URL の変更 ([適用された手順] で[ソース] を選択)。
  • この Excel テーブルのデータをプルするソース テーブルを編集します ([適用された手順] で[ナビゲーション] を選択します)。
  • データをシートに配置する前に Excel がデータを書式設定または変換する方法を変更する ([適用された手順] で [変更された型] を選択します)。

これは、Web クエリの本来の動作に満足できない場合でも、Web クエリ エディター ウィンドウを使用してカスタマイズできることを意味します。

テーブルを手動および自動で更新する方法

リモート Web ページ テーブルから Excel シートに最新のデータを取得する場合、いくつかのオプションがあります。

更新するテーブルを含むシートを選択し、[データ] メニューを選択して、リボンから [すべて更新] を選択すると、手動で更新できます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これにより、外部ソースからデータを取得する、そのシート内のすべてのテーブルの 1 回限りの更新が実行されます。

これを行うより自動化された方法は、更新をスケジュールすることです。これを行うには、[すべて更新] ボタンの下部にあるドロップダウン矢印を選択し、 [接続プロパティ] を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これにより、[クエリのプロパティ] ウィンドウが開きます。[使用状況] タブを選択し、 [ xx 分ごとに更新] を有効にします。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

時間設定を、シート内のテーブルを更新する頻度に変更します。この自動更新は、Excel ファイルが開いている場合にのみ行われることに注意してください。それ以外の場合、ファイル内のデータは更新されません。

Excel での Web スクレイピング

ExcelでWebからデータをスクレイピングする機能は強力です。この機能を使用して自動化し、Web 全体からの最新データで更新されるリアルタイムのダッシュボードを作成できます。関心のある情報で頻繁に更新される複数の Web サイトからデータ テーブルを取り込み、すべてを中央のスプレッドシートに取り込みます。

その後、自動更新されるデータに基づいて、計算、ビジュアル、および完全なダッシュボードをスプレッドシートで作成できます。

Tags: #HOW-TO

[解決済み]錆がクラッシュし続ける問題を修正する方法は?

[解決済み]錆がクラッシュし続ける問題を修正する方法は?

Rustに直面すると、起動時または読み込み中にクラッシュし続けます。その後、指定された修正に従って、Rushクラッシュの問題を簡単に停止します…

Intel Wireless AC 9560 が動作しない場合の 9 つの修正 (コード 10)

Intel Wireless AC 9560 が動作しない場合の 9 つの修正 (コード 10)

Intel Wireless AC 9560 コード 10 の修正方法について詳しく解説します。Wi-Fi および Bluetooth デバイスでのエラーを解決するためのステップバイステップガイドです。

「不明なソフトウェア例外(0xe0434352)」を修正するにはどうすればよいですか?

「不明なソフトウェア例外(0xe0434352)」を修正するにはどうすればよいですか?

Windows 10および11での不明なソフトウェア例外(0xe0434352)エラーを修正するための可能な解決策を見つけてください。

[フルガイド]Steamのファイル権限の欠落エラーを修正する方法は?

[フルガイド]Steamのファイル権限の欠落エラーを修正する方法は?

Steamのファイル権限がないエラーにお困りですか?これらの8つの簡単な方法で、Steamエラーを修正し、PCでゲームを楽しんでください。

Windows 10でアプリとプログラムが自動的に最小化される問題を修正する7つの方法

Windows 10でアプリとプログラムが自動的に最小化される問題を修正する7つの方法

PC での作業中に Windows 10 が自動的に最小化される問題の解決策を探しているなら、この記事ではその方法を詳しく説明します。

学生が学校でブロックされることを気にせずに最もよくプレイするゲーム トップ 10

学生が学校でブロックされることを気にせずに最もよくプレイするゲーム トップ 10

ブロックされることを心配せずに学生が学校で最もよくプレイするゲーム トップ 10。オンラインゲームの利点とおすすめを詳しく解説します。

ワードウォール

ワードウォール

Wordwallは、教師が教室のアクティビティを簡単に作成できるプラットフォームです。インタラクティブな体験で学習をサポートします。

[解決済み]Ntoskrnl.Exe高CPU使用率Windows10

[解決済み]Ntoskrnl.Exe高CPU使用率Windows10

この記事では、ntoskrnl.exeの高いCPU使用率を解決するための簡単な方法を紹介します。

VACを修正すると、8つの簡単な方法でゲームセッションエラーを確認できませんでした

VACを修正すると、8つの簡単な方法でゲームセッションエラーを確認できませんでした

VACを修正するための解決策を探していると、CSでのゲームセッションエラーを確認できませんでした:GO?次に、与えられた修正に従います

INTERNAL_POWER_ERROR(0x000000A0)を修正する方法

INTERNAL_POWER_ERROR(0x000000A0)を修正する方法

簡単に取り除くために、ソリューションを1つずつ実行し、Windows 10、8.1、8、および7のINTERNAL_POWER_ERRORブルースクリーンエラー(0x000000A0)を修正します。