Ajax自動検出
フォローするバージョン7.2では、OctoparseはAJAXを自動検出し、「AJAX読み込み」と「AJAXタイムアウト」を自動的に設定できるようになりました。 以前は、ユーザーは「AJAXロード」の手順を手動で認識して設定する必要がありました。 しかし、今ではOctoparse 7.2ですべてがカバーされています。
AJAXとは何ですか?
AJAXは、非同期JavaScriptおよびXMLの略です。 これは、Webページがページを更新することなくコンテンツの一部を更新できるようにする一連のWeb開発手法です。クリックしてAJAXを適用するWebページを更新すると、再読み込みのような記号は表示されません。
- Ajaxが含まれているとき:
- AJAXがない場合:
- この場合、octoparse . jpがないに対して、Walmart . comはAjax技術が適用されています。
要するに、ページローディングで再読み込み記号があるかどうかチェックすることは、AJAX技術が使用されるかどうかを判断する良い方法です。
ヒント! |
どのようにAjax自動検出動作しますか?
Walmart . comの場合、次のページボタンがクリックされたときに再読み込み記号がないため、Ajaxがページ化に使用されていることを知っています。明らかに、Webページだけは内容(例えば製品情報)の部分を更新します、そして、残りのWebページはリフレッシュなしで同じままです。
どのようにOctoparseがAjaxを検出して、自動的に「Ajax読み込み」のために対応するステップを構成するかについて見ましょう。Walmartの一覧ページ(https://www.walmart.com/search/?cat_id=0&query=pens)を読み込みます。Octoparseで、次のページにわたるボタンをクリックして、「操作ヒント」の上で「次のページをループクリックする」を選んでください、そして、Octoparseが「Ajax 読み込み」を自動的にセットしたとわかります。
「Ajax タイムアウト」は「Ajax 読み込み」と共に使用されます。デフォルトの設定は1または3秒です。すなわち、現在のステップを実行した後に、1または3秒を待ち、次のステップを実行する。
手動で「Ajaxタイムアウト」を設定することもできます。実際のネットワーク環境によっては、5秒以上に設定したい場合があります。
ヒント! |