テンプレートタスクは、Octoparseがさまざまなスクレイピングニーズのある一般的なウェブサイト向けに提供している、すぐに使用できるスクレイピングタスクです。Amazon、Twitter、Google Mapsなどの一般的なテンプレートタスクは、Octoparseのホームページで見つけることができます。
タスクの設定を自分で行うことなく、データを抽出することができます。必要なのは、手順に従って必要なパラメータを入力することだけです。
目的のテンプレートタスクの検索方法
テンプレートギャラリーページにアクセスする方法は3つあります。
テンプレートタスクの使い方
ホームページで検索するか、テンプレートギャラリーページに移動する
テンプレートを選択する
【今すぐ試す】をクリックする
必要なパラメータを入力する
【保存実行】をクリックしてデバイスまたはクラウドでタスクを開始する
または【新規タスクとして保存】をクリックして他のテンプレートに移動し、このタスクは後で開始する
作成したタスクは、ダッシュボードを更新すると表示されます。
有料テンプレート
抽出の複雑さや、一部のウェブサイトで使用されているスクレイピング防止技術のアップデートにより、いくつかのテンプレートを有料のプレミアムテンプレートにアップグレードしました。
テンプレートが有料か、その費用は以下で確認できます:
これらの有料テンプレートを実行するには、アカウント残高にチャージする必要があります。
テンプレートタスクの種類
当社のテンプレートタスクは、ユーザーによる編集はできません。特定のデータフィールドの追加や削除など、特定のテンプレートを変更したい場合は、変更要求をしていただく必要があります。 ユースケース固有のテンプレートが必要な場合、テンプレートのカスタマイズは有料のサービスとなります。
テンプレートタスクには、主にJavaScript/PythonテンプレートとOTDテンプレートタスクの2つのカテゴリがあります。
OTDテンプレートタスクは、Octoparseの高級モードで構築したタスクです。テンプレートを実行するオプションを選択した場合、OTDテンプレートタスクはローカル抽出とクラウド抽出のオプションを表示することがあります。
JavaScript/Pythonテンプレートタスクは、Amazon、Twitter、Indeedなど、より複雑なウェブサイトを扱うために、当社のデータエンジニアリングチームが作成したものです。これらは、より強力なスクレイピング防止技術を回避するために作成されています。 JS/Pythonテンプレートはクラウドでのみ実行できることに注意してください。また、ほとんどの公開JS/Pythonテンプレートには、使用上の制限が設定されています。
カスタマイズテンプレートやテンプレート改訂の依頼方法
追加で、テンプレートのカスタマイズや改訂サービス(有料)を提供しています。パラメータを入力してデータが抽出されるのを待つだけの新しいテンプレートが必要な場合は、テンプレートのカスタマイズを依頼できます。
新しいテンプレートの依頼には2つのオプションがあります。
テンプレートギャラリーページから依頼する
あるいは、Octoparseサポートチームに連絡し、以下の情報を残してください。ご提供いただいた情報のもとに、リクエストを評価させていただきます。
スクレイピングしたいウェブサイト
必要なデータフィールド
プロジェクトの頻度
達成したい最終目標
また、現在のテンプレートに必要なデータフィールドが含まれていないと思う場合も、ニーズを満たす方法を検討できるように知らせてください。
テンプレートタスクの使用に関するTips
バージョン8.5.8では、Octoparseはフィルターなどの機能を追加し、ユーザーが適切なタスクテンプレートを見つけるのがより簡単かつ正確になりました。
お気に入りにマークする
頻繁に使用するテンプレートや興味のあるテンプレートをお気に入りにマークできます。
そうすると、テンプレートギャラリーページのお気に入りカテゴリで見つけることができます。
必要に応じてテンプレートのこだわりを設定する
現在のテンプレートの数はかなりあり、ジャンルや言語の異なるテンプレートを定期的に更新しています。提供している多くのテンプレートから目的のものを見つけるのにはかなり時間がかかる場合があります。
しかし、新しいこだわり機能があるおかげで、テンプレートのキーワード検索、優先言語の選択、テンプレートがサポートしているモードの確認などが簡単にできるようになりました。
テンプレートタスクに関する説明ビデオ