URLリストを使ってデータを抽出する方法
フォローする1. Octoparse URLのループモードを理解する
同じページ構造を共有する複数のページからデータを抽出する場合、OctoparseにこれらのページのURLを入力してループを設定することができます。Octoparseは、URLを1つずつ読み込み、各ページからデータを抽出します。
2. 入力可能なURLの最大量
1つのタスクに20,000件URLを超えないことをお勧めします。URLの長さによっては、この数字は若干異なります。
3. URLリストで新しいタスクを開始する
- URLリストを入力する
「Webサイト」ボックスに複数行のURLを追加すると、Octoparseはデフォルトで「URLリスト」ループモードに入り、自動的にループアイテムを作成します。
- 「実行前に」を設定する
URLが不完全に読み込まれるのを防ぐため、アクションが実行されるまで待機時間を設定できます(通常は2秒が動作します)。
Webページの読み込み前 > 実行前に数秒を待機
4. 入力したURLリストを編集する
「URLループ」のステップを選択し、「基本設定」中のをクリックしてURLを変更することはできます。