Excel での Web スクレイピングのしくみ: Web からデータをインポートする

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

多くの人が、データの記録や計算の実行に Excel を使用しています。しかし、あまり知られていない Excel の機能の 1 つは、インターネットからデータをスクレイピングしてスプレッドシートに取り込む機能です。

この記事では、Excel の Web スクレイピング機能の使用方法を学習します。また、これらの Web スクレイプ クエリがどのように機能するか、およびそれらを自動化する方法についても学習します。

Excel での Web スクレイピングのしくみ

Excel内から「外部」データを取得できます。次の要件に注意してください。

  • コンピューターにはアクティブなインターネット接続が必要です。
  • データを取得する URL には、ページに静的データ テーブルが存在する必要があります。
  • ファイルを自動化する場合、Excel ファイルが保存されているコンピューターにはアクティブなインターネット接続が必要です。

Excel で Web スクレイピングを設定すると、「Web クエリ」が作成されます。このクエリは、Web URL を使用してインターネットに接続し、Web サーバーからデータを含む Web ページを取得します。Excel は受信した HTML を処理し、そのページにあるテーブルを削除します。スプレッドシートにキャプチャするテーブルを選択する機会があります。

Excel Web クエリを作成する方法

次の手順を使用して、任意の Web ページからテーブル データを Excel に取り込みます。この例では気象データを使用していますが、株式市場データなどを使用してこれを行うこともできます。

1. Excel を開き、[データ] メニューを選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

2. リボンの[データの取得と変換]セクションで、[ Web から]を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

3. これにより、Web クエリ ウィンドウが開きます。データを含むページの URL をURLフィールドに貼り付けます。[ OK]を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

4. Excel が到達し、Web コンテンツを取得します。ナビゲーター ウィンドウの左側にある各テーブルの結果を選択すると、右側のペインにテーブルのプレビューが表示されます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

5. スクレイピングするデータを含む Web ページのテーブルがテーブル プレビューに表示されたら、ウィンドウの下部にある[読み込み] ボタンを選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

6. Web ページ テーブルのデータが、アクティブな Excel スプレッドシートの最初のシェルに表示されます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

おめでとうございます。Excel で Web ページのデータをスクレイピングすることに成功しました。

高度な Excel Web クエリ オプション

上記の画面には、いくつかの追加オプションがあります。Web データをスクレイピングして Excel スプレッドシートの別の場所にインポートする場合は、[読み込み] ボタンの横にあるドロップダウン矢印を選択し、代わりに [読み込み先] を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

[データのインポート] ウィンドウが開きます。このウィンドウのオプションを使用して、データを希望どおりにフォーマットして配置します。

ここでのオプションは次のとおりです。

  • 標準テーブル
  • ピボットテーブル レポート
  • ピボットグラフ
  • 接続を作成するだけで、データをインポートしない

デフォルトの A1 ではなく、特定のセルから始まるデータを配置するオプションも表示されます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

URL ページで [基本] ではなく[詳細] オプションを選択すると、より詳細な URL 情報を提供できます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これは、データの読み込み元のページにパラメーター (通常は「?」文字が続く) や、JSON HTTP ヘッダー リクエスト パラメーターを必要とするページなどの特別な HTTP ヘッダー リクエストが含まれている場合に便利です。

これらの高度なクエリ機能を使用すると、データを取得するための静的 URL がないインタラクティブな Web ページからでも、Excel でデータをスクレイピングできます。

Excel Web クエリをカスタマイズする方法

上記のプロセスを使用してデータを取得する Web クエリを作成した後、さらにカスタマイズできます。

Web クエリ エディターにアクセスするには、2 つの方法があります。1 つ目は、結果を含む任意のセルを右クリックし、[テーブル] を選択してから、[クエリの編集]を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これにより、Web クエリ エディター ウィンドウが開きます。または、任意の結果セルを選択し、右側の [クエリと接続] ボックスでテーブルの右側にある小さなシート アイコンを選択することもできます。これにより、選択したテーブル データのプレビューが開きます。このウィンドウの下部にある[編集] ボタンを選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

Web クエリ エディター ウィンドウでは、接続先の Web ページから Web クエリがデータを取得する方法を詳細にカスタマイズできます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

ここでのオプションは次のとおりです。

  • ソース URL の変更 ([適用された手順] で[ソース] を選択)。
  • この Excel テーブルのデータをプルするソース テーブルを編集します ([適用された手順] で[ナビゲーション] を選択します)。
  • データをシートに配置する前に Excel がデータを書式設定または変換する方法を変更する ([適用された手順] で [変更された型] を選択します)。

これは、Web クエリの本来の動作に満足できない場合でも、Web クエリ エディター ウィンドウを使用してカスタマイズできることを意味します。

テーブルを手動および自動で更新する方法

リモート Web ページ テーブルから Excel シートに最新のデータを取得する場合、いくつかのオプションがあります。

更新するテーブルを含むシートを選択し、[データ] メニューを選択して、リボンから [すべて更新] を選択すると、手動で更新できます。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これにより、外部ソースからデータを取得する、そのシート内のすべてのテーブルの 1 回限りの更新が実行されます。

これを行うより自動化された方法は、更新をスケジュールすることです。これを行うには、[すべて更新] ボタンの下部にあるドロップダウン矢印を選択し、 [接続プロパティ] を選択します。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

これにより、[クエリのプロパティ] ウィンドウが開きます。[使用状況] タブを選択し、 [ xx 分ごとに更新] を有効にします。

Excel での Web スクレイピングのしくみ: Web からデータをインポートする

時間設定を、シート内のテーブルを更新する頻度に変更します。この自動更新は、Excel ファイルが開いている場合にのみ行われることに注意してください。それ以外の場合、ファイル内のデータは更新されません。

Excel での Web スクレイピング

ExcelでWebからデータをスクレイピングする機能は強力です。この機能を使用して自動化し、Web 全体からの最新データで更新されるリアルタイムのダッシュボードを作成できます。関心のある情報で頻繁に更新される複数の Web サイトからデータ テーブルを取り込み、すべてを中央のスプレッドシートに取り込みます。

その後、自動更新されるデータに基づいて、計算、ビジュアル、および完全なダッシュボードをスプレッドシートで作成できます。

Tags: #HOW-TO

ジンジャー 2.7.53.0

ジンジャー 2.7.53.0

Ginger は無料のスペル チェッカーと文法チェッカーです。

ブロック

ブロック

Blocks は、小学校 3 年生向けの探知能力と視覚能力を訓練するための知的なゲームであり、教師による IT 指導支援プログラムに組み込まれています。

マスウェイ

マスウェイ

Mathway は、デバイスに内蔵されている電卓よりも複雑なツールを必要とする数学の問題をすべて解決できる、非常に便利なアプリです。

アドビプレゼンター

アドビプレゼンター

Adobe Presenter は、Adobe Systems によってリリースされた e ラーニング ソフトウェアで、Microsoft Windows プラットフォーム上で Microsoft PowerPoint プラグインとして利用できます。

オオハシ 2.3.0

オオハシ 2.3.0

Toucan は教育テクノロジー プラットフォームです。日常的に使用される一般的な Web サイトを閲覧しながら、新しい言語を学習できます。

ENetViet 24.2

ENetViet 24.2

eNetViet は、保護者と子供が勉強している学校を結び付け、子供の現在の学習状況を明確に理解できるようにするアプリケーションです。

デュオリンゴ

デュオリンゴ

Duolingo - 無料で言語を学ぶ、または単に Duolingo は、さまざまな言語を学び、練習できる教育プログラムです。

ラピッドタイピング

ラピッドタイピング

RapidTyping は、タイピング速度を向上させ、スペル ミスを減らすのに役立つ、便利で使いやすいキーボード トレーニング ツールです。RapidTyping では、さまざまなレベルに合わせてレッスンが構成されており、タイピングの方法や既存のスキルを向上させる方法を学びます。

MathType 7.4.10.53

MathType 7.4.10.53

MathType は、開発者 Design Science (Dessci) が提供するインタラクティブな方程式ソフトウェアで、ワード プロセッシング、プレゼンテーション、e ラーニングなどの数学的記法を作成して注釈を付けることができます。このエディタは、TeX、LaTeX、および MathML ドキュメントの作成にも使用されます。

文法的に

文法的に

Grammarly の AI を活用したアプリは、人々のコミュニケーションをより効果的にするのに役立ちます。何百万ものユーザーが毎日 Grammarly を利用して、メッセージ、ドキュメント、ソーシャル メディアの投稿をより明確に、エラーなく、よりプロフェッショナルなものにしています。