Googleマップから店舗の情報を取得する
フォローする旅を出る時Googleマップを使ったことがありますか?220 の国と地域を広くカバーする地図と数億のお店や場所に関する詳しい情報を見えるし、リアルタイムの GPS ナビ、渋滞状況、乗換案内のほか、地元のグルメやイベントに関する情報を、世界中どこでも利用できます。
このチュートリアルでは、Googleマップでレストラン情報をスクレイピングする方法を説明します。
チュートリアルで次のURLを使用します。
以下はチュートリアルの主な手順です。
- 1) 「Webページを開く」 - 内蔵ブラウザで対象のWebページを開く
- 2) ページ遷移のループを作る - 複数のページからデータを取得する
- 3) 「ループアイテム」を作る - 一覧ページからデータを取得する
- 4) 抽出タスクを始める - タスクの実行を行いデータを取得する
1) 「Webページを開く」 - 内蔵ブラウザで対象のWebページを開く
URLを入力して「抽出開始」をクリックし、ページを開きます。
2) ページ遷移のループを作る - 複数のページからデータを取得する
ページ読み込み後、ページ送りボタン「>」をクリックし、「操作ヒント」から「単一要素をループクリップする」を選択します。
GoogleマップはページネーションにAjax技術を適用していますから、「Ajax読み込み」が自動的に設定されました。
チェックした結果、 ページネーションのXPathは少し問題があります。正しいXPathを入力します。
//button[contains(@jsaction,"next")][not(@disabled)]
ヒント! Ajaxの詳細をご覧ください: XPathの詳細をご覧ください:
|
3) 「ループアイテム」を作る - 一覧ページからデータを取得する
- 一番目と二番目の店舗情報を全体としてクリックし、残りの店舗は識別されます。
- 「操作ヒント」から「各要素のテキストを抽出する」を選択します。
- 抽出したいデータをクリックし、「選択した要素のテキストを抽出する」を選択します。
- 必要に応じて、不要なデータを削除、フィールド名を編集します。
ヒント! 必要なセクション全体が強調表示されるまで、セクションの上にマウスを移動します。または「操作ヒント」にある拡大ボタン |
4) 抽出タスクを始める - タスクの実行を行いデータを取得する
「保存」と「実行」をクリックし、データを抽出します。以下はデータのサンプルです。
各店舗の詳細ページに移動し、データを取得したいなら、Googleマップのテンプレートをご利用ください。