Google検索の結果をスクレイピングする
フォローする
Google検索は最も多く使われている検索エンジンですよね。このチュートリアルでは、Google検索のデータをスクレイピングする方法を説明します。
チュートリアルで次のURLを使用します。
以下はチュートリアルの主な手順です。
3.「ページネーション」 - 複数のページからデータを取得する
1.「Webページを開く」 - 対象のWebページを開く
- URLを入力して「抽出開始」をクリックし、ページを開きます。
2.「テキストを入力する」 – キーワードを入力し検索する
- 入力ボックスをクリックし、「操作ヒント」の「テキストを入力する」をクリックします。
- キーワードを入力し、「はい」をクリックします。
- ページの検索ボタンをクリックし、「操作ヒント」の「選択したボタンをクリックする」をクリックします。
ヒント!
|
3.「ページネーション」 - 複数のページからデータを取得する
- ページ読み込み後、ページ送りボタン「次へ」をクリックします。
- 「操作ヒント」の下部にあるタグを「A」タグを選択します。
- 「操作ヒント」の「単一リンクをループクリップする」を選択します。
4.「ループアイテム」 - 一覧ページからデータを取得する
- 該当ページの一番目の検索結果を選択します。セクション全体が強調表示されるまで、「操作ヒント」にある拡大ボタン
をクリックしてください。
- 二番目の検索結果も同じように操作し、残りの部分は識別されます。
- 「操作ヒント」に「各要素のテキストを抽出する」を選択します。
- ハイライトになる部分に取得したいデータを一つずつ選択し、「操作ヒント」の「選択したテキストを抽出する」を選択します。
- 必要に応じて、不要なデータフィールドを削除するとか、フィールド名を変更するとかします。
5.データ抽出 - データ取得のタスクを実行する
- 「保存」と「実行」をクリックし、データを抽出します。もしくは、左上の「実行」をクリックして自動的にタスクを保存でき、タスクの実行画面に入っています。
- 「ローカル抽出」または「クラウド抽出」(有料版のみ)を選択します。
以下はデータのサンプルです。