リストページからデータを抽出し、詳細ページに移動してさらに抽出することは普通ですね。この記事ではスクレイピングする方法を紹介します。
例えば、https://www.octoparse.jp/Blog のブログリストページからブログのタイトルを抽出し、それから、ブログの詳細ページからブログの内容を取得します。
抽出する場合の手順は次のとおりです。
- リストページで一番目タイトルをクリックし、操作ヒントで「すべて選択」をクリックします。
- 「選択した要素(リンク)のテキストを抽出する」をクリックします。
- リストページで一番目タイトルをもう一度選択し、「リンクをクリックする」をクリックして、詳細ページに移動します。
以上の手順に従って、リストページからデータを抽出し、詳細ページに移動してさらにデータを抽出できます。
最終的なワークフローは次のようになります。