「もっと見る」ボタンを対応する方法
フォローする多くのWebサイトでは、リストなどのコンテンツを読み込むために「もっと読む」、「もっと見る」や「さらに表示」のボタン、或いは無限スクロール技術を使用しています。

「もっと見る」ボタンをクリックする
一部のWebページでは、AJAXを介してより多くのコンテンツを継続的にロードするため、「もっと見る」ボタンをクリックする必要があります。
ページから利用可能なコンテンツをスクレイピングするために、すべての情報が読み込まれるまで「もっと見る」ボタンを繰り返しクリックするようにOctoparseを設定します。
https://itp.ne.jp/genre/?genre=9&subgenre=233&area=13101&sort=01&sbmap=falseを例として説明します。
1.自動識別機能でボタンを指定する
1) URLを入力し、「抽出開始」をクリックします。
ページを自動的に識別します。
※自動識別が機能しない場合は、操作ヒントで「Webページを自動識別する」をクリックしてください。
2) 識別された内容の確認・編集
「プレビュー」をクリックすると、Octoparse が正しいボタンを選択したかどうかを確認できます。
正しいボタンが選択されていないと思われる場合には、「編集」をクリックして、手動でボタンの位置を指定することができ、ご要望に応じて、クリックの回数を指定することもできます。
なお、「スクロールダウンを設定する」の下にある「編集」をクリックすると、ご要望に応じて重複回数と実行間隔を設定することができます。
操作ヒントの「ワークフローを生成」をクリックすると、ワークフローが生成されます。下記画像のように、ワークフローが設定されています。
必要に応じて、「ループアイテム」をクリックして「基本設定」にクリック数を編集することができます。
2.手動で「もっと見る」ボタンを指定する

- ワークフローから「次のページをクリック」をクリックします。
- 「詳細設定」から「AJAX読み込み」を選択し、タイムアウトを設定します(通常、1秒または2秒)。
ヒント! 「もっと見る」ボタンを7回クリックしたい場合は、ワークフローから「ページネーション」ループを選択し、「基本設定」に実行回数を7に設定します。
|
5) 各データフィールドを指定します。(レッスン4を参照)。