XPath応用編 - 3.商品リストのデータを指定する
フォローするWebページ上ではリストでデータを表示するのが一般的です。例えば、このように並んでいるリストを見たことありませんか。
このようなサイトからリストとなる部分のデータを取得したかったり、またリンクが含まれた部分を巡回してクリックしたかったりする時はどのようにXPathを書けばいいでしょう。
例:
https://shopping.yahoo.co.jp/search?p=%E8%85%95%E6%99%82%E8%A8%88&aq=&oq=&sc_i=shp_pc_top_searchBox
a) (広告アイテムではなく)各商品のタイトルを指定します。まずはタイトルを右クリックします、それに応じて以下のHTMLと表示されます。
ターゲットされたのはspanタグですが、すべての商品タイトルをクリックする必要があるので、親であるaタグを指定します。
商品タイトルのaタグには「class="_2EW-04-9Eayr"」という属性が含まれていますので、
XPathの書き方で紹介したように、『@』を使ってXPathを下記のように書くことができます。
//a[@class="INxDYHitOXlv"]
b) 上記のXPathをOctoparseのループアイテムのXPath入力ボックスに入れ替えます。
これで、リストページで新しいものが増えてきても、すべてのリストを全部指定することができます。