カスタムデータフィールドを追加
フォローするOctoparseではどのサイトにも通用できる新規フィールドをいくつか用意しています。
新規フィールドを追加する入口
データプレビューで
ボタンをクリックして新規フィールドを追加することができます。


新規フィールドとは何ですか?
新規フィールドとはOctoparseで予め作られて、どのサイトにも追加できるフィールドです。
新規フィールドは次の4種類があります。
1.「ページからフィールドを追加」
このフィールドはページ上にあるデータを自由に選択することができます。
2.「現在の時刻を追加」
このフィールドはデータの抽出時間を取得します。

たとえば、定期取得のスケジュールに合わせてタスクを実行しているとします。このフィールドを追加して、データが取得された時刻を知ることができます。
ヒント!
1.取得したデータを再フォーマットして、現在の時間フィールドのフォーマットを変更できます。
2.クラウド抽出で現在時刻を追加すると、重複データをクラウドで保存することができます。
|
3. 「該当のページ情報を追加」
ユーザーがSEOを改善する必要がある場合は、ページタイトル、メタ説明、およびメタキーワードを取得すると便利です。
該当ページの情報から、「ページのURL」、「タイトル」「メタディスクリプション」「メタキーワード」「ソースコード」を直接に取得します。

-
URL:該当ページのURLを追加する
後のデータチェックのために、該当ページのURLを取得する必要があれば、「ページのURL」を追加すれば済みます。空白のフィールドを抽出したら何をすべきか?
-
タイトル:タイトルタグのコンテンツを取得する
Webページのタイトルとはブラウザウィンドウの上部に表示されたテキストです。
-
メタディスクリプション:メタ記述タグのコンテンツを取得する
タグには、ページコンテンツの概要が含まれます。
-
メタキーワード:メタキーワードタグのコンテンツを取得する
-
ソースコード:ページのソースコードを取得する
4. カスタマフィールドを追加する
このオプションは、空白のフィールドを作成して、ページに必要なフィールドを抽出するのに役立ちます。

「よく使うフィールド」ではよく使われるフィールド名を準備しております。
データの場所を自分で指定したい場合は、空白のフィールドにデータを指定するXPathを入れる必要があります。

ヒント! XPathの書き方について、以下のチュートリアルはお役に立てればと思います。 |