Octoparseで広告、ポップアップを回避する方法
フォローするクローラーの抽出速度は、ページの読み込み速度の影響を受けます。バナーやポップアップなど、多くの広告がWebページに表示されると、ページの読み込みが遅くなり、時間を無駄にします。 広告のブロックにより、ページへのリクエストが減少し、読み込みを速くします。
Octoparseには、広告、ポップアップを回避する方法は2つあります。
1.「Webページを開く」のステップを選択すると、「高級オプション」で「ポップアップをブロックする」を簡単に見つけることができます。
2.タスクの編集画面で、「設定」をクリックすると、「広告をブロックする」オプションが表示されます。
ヒント!
1.広告ブロック技術を使用すると、一部のWebページの構造が変更される場合があります。 その場合、XPathを調整して要素を再配置してください。
XPathを使用して要素を見つける方法の詳細。
2.広告のブロックを使用すると、ページの読み込みの問題が発生する場合があります。 ページがまったく読み込まれないなど、ページが正しく読み込まれない場合は、広告のブロックを選択しないでください。
ヒント! 1. 広告回避を使用すると、一部のWebページの構造が変更される場合があります。その場合、XPathを調整して要素を再配置してください。 2. 広告をブロックすると、ページ読み込みの問題が発生する場合があります。ページがまったく読み込まれないなど、ページが正しく読み込まれない場合は、広告のブロックを選択しないでください。 |