すべてのコレクション
アプリ
Octoparse 8.5.4の新機能
Octoparse 8.5.4の新機能
一週間前以上前にアップデートされました

本記事では、最新のOctoparseバージョンの新機能についてご説明します。古いバージョンのOctoparseを使用している場合は、速くて使いやすく、より強い最新バージョンにアップグレードすることを強くお勧めします!まだアップグレードしていない場合は、こちらからダウンロードしてアップグレードしてください!

数週間のベータテストの後、Octoparseチームは8.5.4のアップデートをリリースしました。このアップデートでは、アプリにいくつかの新機能が追加されています。アカウントセンターが刷新され、新しい決済システムが導入され、自動CAPTCHAバイパス機能、Octoparseプレミアムプロキシサーバ、任意のウェブサイトからのファイルのダウンロード機能などが含まれています。


ファイルダウンロード(ローカル抽出)

最もご要望の多かったダウンロード機能がようやく利用可能になりました!スクレイピング中にウェブページからファイルをダウンロードする機能が新バージョンでアプリに追加され、画像、音声、動画、ドキュメントのダウンロードは可能になります。

mceclip3.png

データプレビューで任意のデータフィールドを選択し、リンクされたすべてのファイルをローカルにダウンロードすることができます。現在ローカル抽出のみ対応しておりますが、クラウド抽出も同じく利用できるように開発しております。


Captchaバイパス

Webスクレイピングを制限するために、CAPTCHAを導入するWebサイトが増えています。以前は、スクレイピングアクションの待ち時間を長く設定するか、ローカルの抽出ウィンドウでCAPTCHAを手動で解決するしかありませんでした。

このプロセスは繰り返しで退屈なだけでなく、大量のデータにスケールアップするために、タスクに何時間も、あるいは何日もかかることになります。そのため、私たちはCAPTCHAを自動的に解決させるバイパス代行サービスがOctoparse内統合しています。

mceclip2.png

この機能は、reCAPTCHA V2、hCatpcha、画像CAPTCHAの3種類の主要なCAPTCHAをサポートしています。


クラウド実行ウィンドウズ

新しいウィンドウでクラウドタスクの実行状況を確認することができます。

mceclip7.png

新しいクラウドランウィンドウは、すべてのサブタスクのイベントログが取れます。また、特定のタイプのエラーが発生したときに、自動的にスナップショットを取ることもできるので、問題を素早く特定することができます。

mceclip8.png

実行設定で「クラウドエラーログのキャプチャを取る」にチェックを入れたら、クラウド抽出する際、リアルタイムでキャプチャを取ることができます。

クラウド抽出を実行中、①「タスク実行」の②実行詳細をクリックすれば、ロカール抽出と同様、タスクの進捗が直接確認できます。

mceclip0.png

プレミアムプロキシサーバ

8.5.4以降では、お持ちのプロキシサーバ以外、ブロックされる可能性を減らすOctoparseが提供されているプレミアムプロキシサーバを利用することもできます。

mceclip5.png

プレミアムプロキシサーバを利用し、地理的制限を回避することができます。


前に戻る

ワークフローアクションに「前に戻る」プロセスを追加しました。これにより、リストページから詳細ページに移動する必要があるにもかかわらず、詳細ページを新しいタブで開くことができないという問題を解決することができます。


文字列の一括入力

複数のテキストボックスにテキストを入力する場合、「テキストを一括で入力する」アクションを使用すると、すべてのテキストボックスを一度に入力することができるようになりました。これは、複数の検索ボックスがあるウェブサイト(例食べログ)を扱う際に非常に便利です。

mceclip6.png

新しい決済システム

サブスクリプションの更新以外、テンプレートやプロキシサーバ(IP)、CAPTCHAバイパスサービスの購入がOctoparse内の決済が可能になりました。

mceclip9.png

従来は、一部のプレミアムテンプレートに1日あたりの利用枠を設定し、ユーザーが無制限に利用するには、サブスクリプション料金とは別に月額料金を定期的に支払う必要があります。

現在使用した分だけ支払えばよいので、予算に合わせて利用することができます。

こちらの回答で解決しましたか?