OctoparseはCAPTCHA / reCAPTHCAを処理できますか?
フォローするCaptchaまたはreCaptchaは、多くのWebサイトで適用される一般的なスクレイピング防止技術です。アカウントにログインしたり、データにアクセスする前にCaptchaを解決するように求められます。
OctoparseはCaptchaを自動的に処理できませんが、この問題の回避策があります。
ローカル抽出でCaptchaを手動で入力する
1. タスクを構築する時、内蔵ブラウザでテキストボックスをクリックして、Captchaを手動で入力します。
2. ログインボタンをクリックする前やCaptchaを解決してからのステップに十分な待ち時間を設定します。
3. タスクをローカルで実行するときは、Captchaを手動で入力するか、抽出ウィンドウに他のタイプのCaptchaを解決することができます。
Captchaに遭遇しないようにクッキーを保存する
タスクを実行するたびにCaptchaに手動で入力するのは非常に不便で、クラウド抽出には適用できません。サイトがクッキーの使用をサポートしている場合は、クッキーを保存してログインした状態を守れます。
ログインクッキーを保存する方法の詳細については、このチュートリアルを参照してください。
ヒント! スクレイピング処理中に遭遇したCatpchaは現在解決できません。待ち時間機能を設定して |