テンプレートモードとは
フォローする
テンプレートモードとは?
Octoparseには数十種類のあらかじめ作成されたテンプレートがあり、瞬時にデータを取得できて、スクレイピングタスクを設定する必要はありません。
Octoparseの新しいタスクテンプレートは、誰でも簡単にWebスクレイピングを利用できるように設計されています。テンプレートを使用すると、タスクの作る学習時間を短縮し、すぐにデータを取得できます。
この時点でテンプレートはAmazon、Twitter、YouTube、Googleなど多くの人気サイトがカバーされています。
また、皆さんがほかのWebサイトを追加したいなら、私たちに教えてください。テンプレートの作成を検討します。
OctoparseのテンプレートモードではURLかキーワードを入力するだけで、データを3つのステップだけで簡単に取得できます。
ステップ1:テンプレートを選択する
Octoparseを起動したら、今の人気テンプレートが表示されています。
テンプレートを探す方法は3つあります。
1つ目はこちらの「もっと見る」ボタンをクリックして一覧画面から探します。
2つ目はこちらのURL入力ボックスにテンプレート名を入力してから探します。
3つ目はサイドバーメニューの一番上にある「新規作成」をクリックして、「テンプレートタスク」から探します。
一覧画面でテンプレートが複数のカテゴリーに分けられています。新しいテンプレートがアップロードされたら、右側の「新着テンプレート」で表示されます。もしこちらに欲しいテンプレートがない場合、一番右上にある「新規テンプレートが欲しい」をクリックして、カスタマサポートに欲しいテンプレートを送信してください。
カテゴリーから取得したいテンプレートを選択します。例えば、「プロダクト」から「楽天」をクリックします。
「楽天」の下にある「プロダクト データ 楽天」をクリックしたら、テンプレートの紹介画面に入ります。
こちらの「テンプレートの紹介」では適用条件や使い方などを簡単に説明されています。
- 「データレビュー」では取得できるデータフィールド名が表示されています。
- 「パラメータレビュー」ではテンプレートを使うためのパラメータの画像が表示されています。
- 「サンプルデータ」ではテンプレートで取得できたデータが表示されています。
ステップ2:パラメータを入力する
「今すぐ使う」をクリックしてパラメータの入力画面に入りました。
ここでは事前に準備しておいた検索結果のURLを貼り付けます。
テンプレートによって、パラメータとしてのURLとキーワードを複数入力することもできます。
ステップ3:テンプレートを実行する
それから、左下にある「保存して実行」ボタンをクリックします。
もしテンプレートを使っている中で、エラーが発生した場合、右側の「エラーを報告」ボタンをクリックして、カスタマサポートにエラー報告を送信してください。
「ローカル抽出」「クラウド抽出」「実行スケジュール」といった実行方法を選択するポップアップが現れました。ローカル抽出は、自分のコンピューターのIPを使用して実行します。クラウド抽出はOctoparseのクラウドサーバーを利用してローカルより素早くデータを取得できます。実行スケジュールはローカルかクラウド上で定期的にデータを取得できます。ここではローカル実行を選択します。データ収集が完了したら、Excel、CSVやデータベースなどへのエクスポートができます。
保存して実行したテンプレートタスクは、サイドバーメニューの「ダッシュボード」に保存されます。
「ローカル抽出」の「データ件数」をクリックすると、取得されたデータが表示されます。こちらの「エクスポート」をクリックして、データをエクスポートすることもできます。