条件判断
フォローする応用シーン
条件判断は、一連の異なるページをクロールする際に最もよく使われます。次のサイトを見てみましょう。 詳細ページでは、カラー情報があるもの、サイズ情報があるもの、1つの仕様しかないものなどがあります。
1つのタスクで、個々のアイテムのカラーやサイズやに関する情報をどのように収集するのか? そこで、条件判断が重要になります。
ワークフロー全体
利用可能のオプション
オプション | アクション |
判断せず分岐を実行する | 判断せず、条件分岐内のステップを実行する(右端のブランチのみ適用) |
該当ページに次のテキストが含まれる | 現ページに指定テキストを探す |
該当ループアイテムに次のテキストが含まれる |
現ループアイテムに指定テキストを探す |
該当ページに次の要素が含まれる | 現ページに指定要素(入力したXPathに従う)を探す |
該当ループアイテムに次の要素が含まれる | 現ループアイテムに指定要素(入力したXPathに従う)を探す |
実行順
左から右へ進みます
注意点
1.左端の条件分岐設定が「判断せずに分岐を実行する」にする場合、判断結果が「真」となり、それ以降の条件分岐に進めません。そのため、判定条件を左から右へご設定ください。
2.条件が満たされるデータのみを抽出する場合は、右端のブランチは空白にしてください。
3.条件分岐に複数の「データを抽出」ステップが含まれる場合、各ステップのフィールド名と数を統一する必要があります。
手順
例URL:https://shop.d-kintetsu.co.jp/shop/r/r4010/
1.検索結果ページと詳細ページを同時にスクレイピングする(ガイド)
2.ページに「カラーを選択」がある場合、カラーとその価格を抽出する
例URL:https://shop.d-kintetsu.co.jp/shop/g/gY180320100209003/
- 詳細ページを開いた後「条件分岐」を追加します。選択すると、2つのブランチが自動的に生成されます。
- 一番目の条件分岐をクリックし、基本設定に「該当ページに次のテキストが含まれる」を選択し、「カラーを選択」を下のテキストボックスに入れます。
- 存在すれば、カラーをクリックし、カラー、在庫と値段を抽出します。(ガイド)
実行結果
3.ページに「サイズを選択」がある場合、サイズとその価格を抽出する
例URL:https://shop.d-kintetsu.co.jp/shop/g/gY190806100012002/
- 二番目の条件分岐をクリックし、基本設定に「該当ページに次のテキストが含まれる」を選択し、「サイズを選択」を下のテキストボックスに入れます。
- 存在すれば、サイズをクリックし、サイズ、在庫と値段を抽出します。(ガイド)
実行結果
4.ページにカラーもサイズもない場合は、単純に価格情報を抽出する
例URL:
https://shop.d-kintetsu.co.jp/shop/g/gC220817600011002/
サンプルデータ