レッスン4:タスクをテスト実行する
フォローする
タスクの作成が完了し、これから実行します。その前に、もう1つ必要なことがあります。各ステップをクリックして、ワークフローが希望通りに動いているかどうか、またデータを取得できているかどうかを確認します。
下記の参考URLを使って作ったタスクのワークフローを確認します。
一、ワークフローのステップをクリックする
ワークフローのステップは上から下、外側から内側という形となっているので、ワークフローをチェックする時も同じように上から下、外から内へとクリックします。
参考URLを使って作ったタスクのワークフローは下の画像で表示されたように順番通りにチェックしていきます。
- 「Webページを開く」→Webページが正しく読み込まれているかどうかをチェック
- 「ページネーション」→「次のページ」ボタンが正しく指定されているかどうかをチェック
- 「次のページをクリック」→次のページに移動できるかどうかをチェック
- 「ループアイテム」→アイテムにあるリストが正しいかどうかをチェック
- 「データの抽出」→データが選択され、正しく抽出されているかをチェック
すべてのタスクがこのようなワークフローではなく、まったく異なる場合もありますが、チェック方法は大体同じですので、これからチェックしてみましょう。
1.「Webページを開く」をチェックする
ステップをクリックすると、Octoparseの内蔵ブラウザーがWebページを読み込みます。特別な技術が使われていないWebサイトであれば、一般的に正常通りに開けます。ただし、いくつか注意点があります。
1.1Webサイトが無限スクロールダウンで読み込む場合→「Webの読み込み後」で「スクロールダウン」を設定する必要があります。

1.2 Webページの読み込みに通常より時間がかかる場合→ページのタイムアウトを長くします。

2.「ページネーション」をチェックする
ページネーションをうまく動かせるためには、「次へ」ボタン/矢印が正しく指定されているかどうかを確認する必要があります。
ページネーションが問題ない場合は、「次のページをクリック」をクリックしてからも、「ページネーション」では「次へ」ボタンを正しく指定しているはずです。

3.「次のページをクリック」をチェックする
「次のページをクリック 」をクリックすると、「ページネーション」で指定された「次へ」ボタンをクリックします。 このような作業を回数繰り返して、ページネーションが機能できているかどうかを確認します。
ページネーションがうまく動かない場合は、「次へ」ボタンを正しく指定していないということです。その場合、「次へ」ボタンを指定するXPathを手動で修正する必要があります。
- 「次へ」ボタンを指定するXPathの書き方についておわからない方にはページ送りボタンを指定する方法
をご参照ください。
- ページネーションがうまくいかない場合の解決方法は下記の記事をご参照ください。
4. 「ループアイテム」をチェックする
「ループアイテム」では、基本的に、必要なアイテムがすべて正しく選択されているかどうかを確認します。
中にあるアイテムをクリックしたら、内臓ブラウザーが希望先のWebページに移動します。選択されたアイテムがハイライトで表示されます。

または、「ループアイテムを切り替える」アイコンをクリックしてアイテムのリストをクリックして、アイテムが正しく選択されているかどうかを確認します。

リストされたアイテムがすべて選択されていない場合の解決方法は下記の記事をご参照ください。
5.「データを抽出」をチェックする
最後に、データが抽出されているかどうかを確認します。

「データを抽出」をクリックしたら、データプレビューでデータがあっているかどうかを確認します。
空白のフィールドが表示されたり、データが間違っていたり場合の解決方法は下記の記事をご参照ください。
二、タスクを実行する
タスクワークフローの各ステップのチェックが完了できたら、ローカルでタスクを実行します。「保存」と「実行」をそれぞれクリックして、「ローカル抽出」を選択します。
ローカルではデータを取得する実況を見ることができます。
必要なデータが取得できない理由については、下記の記事をご参照ください。
- なぜOctoparseが停止し、データが抽出されないのですか?
- 抽出したデータが多く重複してしまうのはなぜでしょうか?
- AJAXが使われたWebサイトでなぜ重複データを取得し続けるのか?
- リストページから抽出するときにエラーが発生するのはなぜですか?
上記の記事がお役に立てなければ、カスタマーサポートまで具体的な原因をお問い合わせください。
タスクの設定が確認できたので、これからタスクを実行してデータを取得してみましょう。
次へ
レッスン5:データを取得する