こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
CAPTCHAは、多くのウェブサイトで使用されるスクレイピング防止技術です。Octoparseは自動的にCAPTCHAを処理することはできませんが、今日はこの問題に対する4つの回避策についてご説明します。
1. ローカル抽出時のブラウズモードで手動解決する
右上のブラウズモードを有効にし、普段ブラウザでCAPTCHAを解決するように手動で解決します。CAPTCHAを解決後はブラウズモードを無効にして、タスクの作成を続けます。
2. CAPTCHA対策としてクッキーを保存
ブラウズモードでCAPTCHAを解決後、現在のページのクッキーを保存することで、再度CAPTCHAが現れる可能性を減らせます。
「Webページを開く」をクリックし、設定セクションの「詳細設定」を選択して、「特定のCookieを使用」にチェックを入れます。
3. ローカル抽出時に手動解決
ローカル実行開始直後にCAPTCHAが表示された場合は、以下の回避方法があります。
ブラウザ上で直接「一時停止」をクリックします。
抽出ウィンドウ内で手動でCAPTCHAを解決します。
抽出ウィンドウ左上の「続行」ボタンをクリックで実行を再開します。
4. OctoparseのCAPTCHA解決ツールを使用(バージョン8.5.4)
Octoparse v8.5.4からは、CAPTCHAを自動解決する機能が追加されました。詳細は「CAPTCHAを解決する」のチュートリアルをご確認ください。