すべてのコレクション
よくある質問
なぜOctoparseがスクレイピング中にページをスキップするのか?
なぜOctoparseがスクレイピング中にページをスキップするのか?
一週間前以上前にアップデートされました

こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。

ユーザーの間で、OctoparseがあるWebサイトのページをスクレイピングする際に、一部のページを飛ばしてしまうケースが報告されています。例えば、最初の1ページから2ページに移動するのは成功したものの、2ページから次のページにうまく移動できません。再度最初のページに戻って、2ページ以降のすべてのページをスキップしてしまいました。

原因は、ページネーションループの自動生成XPathが、すべてのページの次へボタンを常に検出できないためです。

Octoparseで自動生成されたXPathをコピーし、Webページで検証します。

Webページで検証してみると、2~13ページに「次へ」と「前へ」2つのボタンが特定されます。

ページスキップ問題の解決方法は?

この問題は次のように簡単に解決できます:「次へ」ボタンが常に検出できるようXPathを修正します。

  • 通常のブラウザで「次へ」ボタンを調べ、ソースコードをチェックします。

「次へ」テキストを利用し以下のようなXpathを書きます。

//p[@class="pagination-parts"]/a[text()='次へ']

(XPathを書く方法はこちらをご覧ください)

  • OctoparseにXPathを入力し、常に「次へ」ボタンが検出できるか確認します。

注意:ページネーションループを設定後は、このチュートリアルのように手動でページをいくつか移動し、自動生成XPathが正確に「次へ」ボタンを検出できるか確認する必要があります。

こちらの回答で解決しましたか?