Octoparseではどのサイトにも通用できる新規フィールドをいくつか用意しています。
新規フィールドを追加する入口
データプレビューで「フィールドを追加」ボタンをクリックして新規フィールドを追加することができます。
新規フィールドとは何ですか?
新規フィールドとはOctoparseで予め作られて、どのサイトにも追加できるフィールドです。新規フィールドは次の4種類があります。
1.ページからフィールドを追加
このフィールドはページ上にあるデータを自由に選択することができます。
2.現在の時刻を追加
このフィールドはデータの抽出時間を取得します。
たとえば、定期取得のスケジュールに合わせてタスクを実行しているとします。このフィールドを追加して、データが取得された時刻を知ることができます。
3. 該当のページ情報を追加
ユーザーがSEOを改善する必要がある場合は、ページタイトル、メタ説明、およびメタキーワードを取得すると便利です。
該当ページの情報から、「ページのURL」、「タイトル」「メタディスクリプション」「メタキーワード」「ソースコード」を直接に取得します。
URL:該当ページのURLを追加する
後のデータチェックのために、該当ページのURLを取得する必要があれば、「ページのURL」を追加すれば済みます。
タイトル:タイトルタグのコンテンツを取得する
Webページのタイトルとはブラウザウィンドウの上部に表示されたテキストです。
メタディスクリプション:メタ記述タグのコンテンツを取得する
タグには、ページコンテンツの概要が含まれます。
メタキーワード:メタキーワードタグのコンテンツを取得する
ソースコード:ページのソースコードを取得する
4. カスタマフィールドを追加する
このオプションは、空白のフィールドを作成して、ページに必要なフィールドを抽出するのに役立ちます。
5. 入力元URLを追加
URLのリストをスクレイピングする場合、ターゲットデータと共に入力元URLをフィールドとして取得することで、スクレイピングされていないURLがないか照合することができます。