すべてのコレクション
よくある質問
データプレビューに表示されたデータが実際のデータ抽出時にない理由は何か
データプレビューに表示されたデータが実際のデータ抽出時にない理由は何か
一週間前以上前にアップデートされました

ワークフロー自体は問題ないように見えながら、実際には必要なデータがすべて正常に抽出できないこともあります。これは何が原因なのでしょうか。データプレビューではデータが見られるのに、タスク実行時には取得できない、というトラブルはどうして起きるのでしょうか。この問題に悩まれている方は、以下の記事内容を通じて、このトラブルに効果的な対策をいくつか利用できると思います。問題の原因を正しく特定し対策を利用することで、データ取得成功率を上げられると思います。


原因1:「Webページを開く」アクションのデフォルトタイムアウトが短い

Webページが完全に読み込まれる前にOctoparseが抽出を停止する場合、必要なページデータが次のアクションに移る前に読み込まれない可能性が高いです。

解決法: 次のアクションに移る前にページが完全に読み込まれるように、「Webページを開く」アクションのタイムアウトを長く設定します。

  • ワークフローの「Webページを開く」アクションをクリックし、「基本設定」アクションのタイムアウトを長く設定します。


原因2:対象Webサイトに読み込み遅延がある

Webページは完全に読み込まれているのに、Octoparseが停止してデータを抽出しない場合は、必要なページデータに読み込み遅延がある可能性が考えられます。多くのWebサイトはJSONを使ってページを更新しますが、これが要素の読み込み遅延の原因となります。

解決法:「Webページを開く」アクション後の次のアクションに待機時間を設定する

  • ワークフロー上の「Webページを開く」アクションの次のアクションをクリックし、「詳細設定」タブで実行前に数秒を待機を設定します。(待機時間の設定方法はこちらの記事を参考にしてください)


原因3:対象Webサイトで遅延読み込みが使用されている

スクロール前に見えるデータ以外は読み込まれない場合、対象Webサイトが遅延読み込みを採用していると考えられます。

Octoparseに対し、ページ読み込み後にスクロールダウンするよう指示する必要があります。

解決法:ページ読み込み後にスクロールダウンを設定をする

  • ワークフローの「Webページを開く」アクションをクリックし、「詳細設定」タブの「スクロールダウン」をチェックします。詳細設定は必要に応じて調整します。


原因4:設定したAJAXのタイムアウトが短い

「もっと見る」「読み込み中」ボタン下に隠れたデータを処理するクリックアイテムがワークフローにある場合は、データ更新が完了するだけの長いAJAXロードタイムアウトが設定されているか確認します。

解決法:クリックアイテムのAJAXタイムアウトを長く設定する

  • ワークフローのアイテムをクリックをクリックし、「Ajax読み込み」にチェックを入れ、長いタイムアウト期間を設定します。

こちらの回答で解決しましたか?