新しいOctoparseバージョン8.1には大きな変更があるため、この記事はシリーズをまとめて、必要なデータを抽出するための新しい改善された機能を活用できるようにします。
これらのレッスンを読み終えると、Octoparse 8.1を完全に理解し、そこにあるほとんどのWebページからデータを取得できるようになります。
まず、インターフェースの紹介とコア機能の説明から始めましょう。
1.インターフェイス
- ホーム画面
- サイドバーメニュー
- ワークスペース
2.コア機能
- タスクテンプレート
- カスタマイズモード
- クラウド抽出
1.インターフェース
Octoparseにログインするとすぐに、ホーム画面とサイドバーメニューの2つのメインセクションが表示されます。
1.1ホーム画面
ホーム画面の中央には検索バーがあります。 WebページのURLを入力してタスクの作成を開始するか、テンプレート名(AmazonやeBayなど)を入力して、事前に作成されたスクレイピングテンプレートを検索することもできます。
ホーム画面から、最も人気のあるスクレイピングテンプレートやチュートリアルにアクセスすることもできます。
1.2サイドバーメニュー
左側のサイドバーメニューには、OctoparseでWebクローラーを作るために必要なものがすべて含まれています。
+新規作成:新しいタスクを作成/インポートするか、新しいタスクグループを作成します。

ダッシュボード:すべてのスクレイピングタスクを管理する場所。タスクを編集、削除、名前変更、整理します。また、タスクを実行、停止、またはスケジュールすることもできます。
クイックフィルターと最近の編集:これを使って、タスクをすばやく開けます。
1.3ワークスペース
Octoparseワークスペースは、タスクを作成する場所です。主に4つ部分があります。

内臓ブラウザ:WebページのURLを入力すると、WebページがOctoparseの内臓ブラウザに読み込まれます。ブラウザモードでは普通のブラウザのようにWebサイトを閲覧するか、または選択モードで抽出したいデータを選択します。
ワークフロー:Webページを開いたり、ページ要素/ボタンをクリックしたりするなどのプロセス全体がワークフローの形で自動的に生成されます。
操作ヒント:操作ヒントに従って、タスクを作成できます。
データプレビュー: Octoparseで識別されたデータがここで表示されます。データフィールドの名前を変更したり、不要なフィールドを削除したりすることができます。
2.コア機能
2.1テンプレートタスク
タスクテンプレートは、必要なテンプレートを選択するだけで、ユーザーがURLかキーワードパラメーターを入力してデータを取得するための事前に作成されたタスクです。現在、60個を超える人気のあるWebサイトのテンプレートがあります。 タスクを作る手間がかからなくても、すぐに欲しいデータを手に入れることができます。
2.2カスタマイズタスク
テンプレートと異なり、カスタマイズモードは非常に柔軟で強力なスクレイピングモードであり、そちらの条件に合わせてタスクを自由にカスタマイズできます。カスタマイズモードは、JavaScript、AJAX、または動的なWebサイトのあるページなどの複雑なWebページにも対応できます。
カスタマイズモードでタスクを作成することに難しく思う人がいるかもしれませ。Octoparse8.1バージョンではデータを自動的に識別することにより、リストの抽出、次のページへの移動、詳細ページに飛んでからのデータ取得などのステップを自動的に追加することができます。

自動検出されたデータに加えて、タスク設定をいつでも手動で編集したり、自動識別ステップをスキップして最初からタスクを作成したりできます。

自動検出されたデータで十分であれば、タスクの設定を保存するだけで、Octoparseがタスクワークフローを自動的に生成します。ワークフローにステップを追加したり、必要に応じてアクションを手動で変更したりできます。
2.3クラウド抽出
Octoparseは、プレミアムユーザー(スタンダード以上)が24時間タスクを実行できる強力なクラウドプラットフォームを提供します。「クラウド抽出」でタスクを実行すると、IPを使用して複数のサーバーでクラウドで実行されます。タスクの実行中にアプリまたはコンピューターをシャットダウンできます。ハードウェアの制限について心配する必要はありません。
抽出されたデータはクラウドに保存され、いつでもアクセスできます。自動IPローテーション、タスクスケジューリング、抽出の高速化、Octoparse APIなどの高度な機能は、すべてOctoparse クラウドサービスの一部です。