すべてのコレクション
ヘルプ
高度な機能
「データを抽出」にトリガーを追加する
「データを抽出」にトリガーを追加する
一週間前以上前にアップデートされました

Octoparseでは、トリガーを使用して特定の条件や制約を設定し、データ行を判断して保持するか削除するかを迅速に決定することができます。これにより、ユーザーは必要なデータのみを直接抽出できるため、データセット全体をスクレイプしてから後で不要なデータをExcelやCSVファイルから削除する必要がありません。

トリガーを使用する場合は?

場合1:

例えば、電子商取引のウェブサイトから商品をスクレイピングし、価格が$100未満の商品のみを抽出したい場合、トリガーを使用して不要なデータ行を捨て、必要なデータのみを保持することができます。

これを実現するために、次のようなトリガーを作成します:データフィールド「価格」が$100以上である場合、「データを捨てる」。これにより、Octoparseはデータを抽出する前に、定義された基準を満たしているかどうかを判断します。結果として、データセットには必要なデータのみが含まれます。

場合2:

もう1つの応用例は、特定の日付に関連するデータを抽出する場合です。例えば、今日(例:2020年01月01日)に公開されたすべてのニュース記事を抽出したい場合、トリガーを作成できます:データフィールド「日付」が「2020-01-01」と等しくない場合、「データを捨てる」。その結果、2020年01月01日の記事のみを取得できます。

複数の条件を組み合わせることも可能です。例えば、2020年01月01日のニュース記事を抽出し、かつ記事のタイトルに「CPI」という単語が含まれている場合、次の2つの条件を使用して行うことができます:

条件1:データフィールド「日付」が「2020-01-01」と等しくない場合、「データを捨てる」

[AND]

条件2:データフィールド「タイトル」が「CPI」を含まない場合、「データを捨てる」


トリガーの使用方法

ステップ 1. 新しいトリガーを作成する

  1. データを抽出アクションに移動します。

詳細設定タブで「+新規トリガー」をクリックして、新しいトリガーを作成します。


ステップ 2. トリガーに名前を付ける

トリガー名のボックスに直接入力して、トリガーに名前を付けます。


ステップ 3. ターゲットフィールドを選択し、条件を設定する

  1. ドロップダウンメニューから1つのターゲットフィールドを選択します。

  2. 選択したデータフィールドに対して条件を設定します。条件は「テキスト」、「数字」、または「日時」に基づいて設定することができます。

    3つの異なる条件は、テキストから数字、さらには日時まで、ほとんどの要求をカバーできます。

    a.テキストの場合


    テキストに対しては、5つのオプション(次に等しい、次に等しくない、次を含む、次を含まない、空白ではない)があります。

    例えば、「次を含む」を選択し、テキストボックスに「スカート」と入力した場合、条件全体は次のようになります:「タイトル」データフィールドが「スカート」という単語を含んでいる場合。

注意:

  • テキストは大文字と小文字を区別します。正しいテキストが入力されていることを確認してください。

  • 空白ではない」が選択されている場合、テキストボックスに入力する必要はありません。条件は次のようになります:「タイトル」データフィールドが空でない場合。

b. 数字の場合

数値には4つのオプション(次より大きい、次より小さい、次より大きいかまたは等しい、次より小さいかまたは等しい)があります。

例えば、データフィールド「価格」を選択し、「次より大きい」として値「500」を入力した場合、条件は次のようになります:「価格」データフィールドが「500」より大きい場合

注意: フィールドには数字のみが含まれていることを確認してください。テキストが含まれている場合は、データを再フォーマットする機能を使用して調整することができます。例えば、価格が"$100"の場合、トリガーを設定する前に通貨記号"$"を削除する必要があります。

c. 時刻と日付の場合

時刻と日付には4つのオプション(次より後、次より前、次より後または等しい、次より前または等しい)があります。

例えば、データフィールド「時間」に対して、「次より後」を選択し、「抽出日の0時」を指定して「このデータを捨てる」とする場合、条件は次のようになります:もし時間が抽出日の0時以降であれば、データを捨てます。その結果、抽出日の0時より前に公開されたデータのみが取得されます。

また、時刻や日付の範囲をカスタマイズすることもできます。

データを再フォーマットして、フォーマットを「yyyy-MM-dd HH:mm:ss」に変更することもできます。このフォーマットはトリガーによって認識されます。


ステップ 4. [AND]または[OR]を使用してさらなる条件を追加する

同じトリガーに複数の条件を追加することができます。条件間の関係を定義するために、条件[AND]または条件[OR]を使用します。


「[AND]条件を追加」をクリックして条件を追加すると、データフィールドが両方の条件を満たす場合にアクションが実行されます。

「[OR]条件を追加」をクリックして条件を追加すると、データフィールドがいずれかの条件を満たす場合にアクションが実行されます。


ステップ 5.「実行する」からアクションを選択し、「確認」をクリックして保存します。

条件がトリガーされた場合、Octoparseは以下のいずれかの手順を実行します。

a. このデータを捨てる

「このデータを捨てる」が選択された場合、Octoparseは抽出手順でトリガーされたかどうかに関係なく、データ行全体を破棄します。

b. ループを終了

「ループを終了」が選択された場合、終了するループアイテムを選択する必要があります。

c. 実行を終了する

「実行を終了する」が選択された場合、該当する条件が満たされた時点で抽出が終了します。

ヒント: 変更を保存した後、既存のトリガーを編集、コピー、削除、無効化することができます。

こちらの回答で解決しましたか?