条件分岐によるスクレイピング
フォローするすべてのページが同じではないので、 Webページに変化が出た場合、条件分岐を使ってスクレイピングします。
以下は処理手順です:

質問:条件分岐をいつ使うべきですか?
答え:条件分岐には、主な状況が2つあります。
1) 「New」、「人気商品」、「セール中」など、特定のタグを持つページからのデータを取得する場合
2) ページ上のデータが異なる形で表示されている場合
下の画像では、セール中のパソコンに関する情報が必要です。商品の詳細ページを見ると、セールアイコン
を判断条件としてテストできます:商品ページに要素
がある場合は、商品情報を取得します。 そうでなければ、スキップします。



その手順を見てみましょう!
1) リストにある各商品をクリックする用のループを作ります。
2) 分岐判断を使って
がページに存在するかどうかをテストします。

- ステップの間にある
ボタンをクリックして、「条件分岐」を追加します。
- 左側の条件分岐をクリックし、基本設定に「該当ページに次の要素が含まれる」を選択します。
- 「要素のXpath」(XPathの検索方法
)のテキストボックスにXPath要素:.//div[@class="pricing-price__savings"]を入力します。
- 「保存」をクリックします。
- 右側の条件分岐をクリックし、「判断せずに分岐を実行します」を選択します。
- 「保存」をクリックします。
ヒント!
Octoparseでは、次の条件に設定できます。
|
3) 商品の詳細ページ(要素があるループから1つを選択)で、取得したいデータフィールドをクリックします。必要に応じてフィールドの名前を変更します。
4) 「データを抽出」を左の条件分岐に追加します。
これで、ページ上の要素を探すように設定しました。要素があれば、データをスクレイピングし、それ以外はスキップします。
ヒント!
|
関連記事: