Ajax自動検出
フォローする多くのWebサイトは、Ajax技術を適用して、より優れた、より速くWebページを作成しています。Ajaxを適用したページからデータを取得する場合、Ajaxを設定する必要があります。この記事では、OctoparseでAjaxを処理する方法について説明します。
1. Ajaxとは?
Ajaxは「非同期JavaScript + XML」の略で、ページ全体を再読み込みせずにWebページの一部情報を更新する技術です。つまり、Ajaxが適用されたWebページを更新すると、リクエストされた部分だけが変わり、その以外の部分が変わりません。
2. Ajaxであるかどうかをわかるには?
要素(ボタン)をクリックしても、AjaxのWebページは再読み込みされないため、要素をクリックした後に再読み込み記号を確認することで、AJAXが使用されているかどうかを簡単に確認できます。
Ajaxの場合、要素をクリックした後、再読み込みの記号はありません。
Ajaxではない場合、再読み込みの記号が表示されます。
3. OctoparseでAjaxを処理するには?
Octoparseは、Ajaxの自動検出機能があり、自動的に設定することができます。しかし、識別失敗した可能性があるので、手動で設定する必要もあります。
- Ajax自動検出
Octoparseは、ページがAjaxを使用していることを検出すると、Ajaxタイムアウトを自動的に設定します。
たとえば、WalmartはAjaxを使用して次のページを読み込みます。したがって、ページ送りボタンをクリックすることを選択すると、Octopareは自動的にAjaxタイムアウトを設定します。
タイムアウトが短すぎる場合は、操作ヒントでタイムアウトを編集できます。
- Ajaxを手動で設定する

ヒント! Ajaxタイムアウトは、ページが必要な情報を読み込むのに十分な時間である必要があります。 |
4. AjaxのないWebページにAjaxタイムアウトを設定する
Ajaxのないページの場合、必要な情報が読み込んだが、再読み込みはまだ行われています。Octoparseは、次のステップを実行する前に、読み込みが完了するまで長時間待機します。この場合、Octoparseに次のアクションに強制的に移行させるようにAjaxを設定して読み込みを停止することができます。