タスクとは?
フォローする1) タスクとは?
Octoparseのタスクは、Webサイトからデータをスクレイピングするプログラムのことです。
2) タスクの種類
Octoparseにはカスタマイズモードとテンプレートモード2種類のモードがあります。そのため、カスタマイズモードで作ったのはカスタマイズタスク、テンプレートモードで作ったのはテンプレートタスクと言います。
この2種類のモードについて、下記の記事をご覧ください。
3) タスク管理
作ったタスクは「ダッシュボード」画面で表示されます。
-
タスク情報の編集
Octoparseでは、入力したURLを保存するとタスク名が自動的に作成されます。編集するには、タスク名隣の鉛筆アイコンをクリックしてください。
-
タスクの一括操作
タスクボックスの左側にあるボックスにチェックを入れると、さまざまな操作オプションが出ています。
-
ほかのオプション
タスクの「…」をクリックすると、下記のような操作ができます。
- エクスポート
- コピー
- 削除
- タスクID
- ロカール抽出
- クラウド抽出
- 他の機能
4) よくある質問
タスクIDはどこにありますか
「ダッシュボード」から、各タスクのメニューをクリックすると、タスクID(API)より、タスクIDを確認することができます。
親タスクと子タスクとは何ですか?
Octoparseでは、タスク1と抽出されたURLを他のタスク2(連携できるタスク数は100まで)を連携することができます。つまり、タスク1がタスク2にURLを提供できます。URLを提供するタスク1は「親タスク」と呼ばれ、親タスクからのURLを使用するタスク2は「子タスク」と呼ばれます。
親タスクを設定する方法は?
1)親タスクでURLを取得できましたら、タスク2で「ループアイテム」を利用して、取得先のサイトを開いて詳細情報を収集します。
- カスタマイズモードで新しいタスクを作成します。
- 「URLを入力する」で「タスクからインポートする」モードを選択し、URL入力画面で親タスクのあるグループとタスクを選択します。
- 「保存する」をクリックします。
- これで「ループアイテム」にはタスク1で取得しURLがすべてタスク2にインポートすることができました。
- ご要望に合わせて必要なデータを選択すれば、タスクが作り上げます。
ヒント! 1.「タスクからインポートする」はOctoparse クラウド抽出の時のみ利用できます。 2.親タスクで少なくとも1つのURLを抽出してから、子タスクを実行してください。 3.URLの一括入力方法は、URLの一括インポート |