商品詳細ページでは、多く商品画像を表示するために、スライダーの技術を使います。そのため、スクレイピングが困難になります。この記事では、スライダーから画像を取得する3つの方法を紹介します。
1. 1枚画像を1つの列に取り込む
複数の画像を異なる列にスクレイピングするのは、画像1枚をスクレイピングするのと同じくらい簡単です。 以下のURLをデモに使用します。
Webページで1枚画像をクリックし、操作提案から「画像URL」を選択し、その動作を繰り返してすべての画像のURLを取得するだけです。
取得したデータは下記のようになります。
2. 画像を異なる行に取り込む
1つの列で、画像を異なる行に取り込むには、すべての画像要素を含めてるループを構成する必要があります。
Webページの最初の画像を選択し、引き続き2つ目の画像を選択し、操作提案から「画像URL」を選択します。そうすると、ループアイテムが生成されます。
取得したデータは下記のようになります。
3. すべての画像を1列にスクレイピングする
画像を1列にスクレイピングする方法が2つあります。
場合1. 抽出した画像URLを1行にマージする
画像URLを別々の行にループ抽出した後(「画像を異なる行に取り込む」のステップに従う)、抽出したデータをマージして1つの行にまとめることができます。
場合2. スライダーのHTMLコードをスクレイピングし、コードから画像URLをマッチングする
スライダー全体を選択し、「OuterHTML」を選択します。
フィールドの「ほかのオプション」アイコンをクリックし、「データを再フォーマット」を選択します。
「ステップを追加」をクリックし、「正規表現によるマッチング」を選択します。
コードを調べて、画像URLの開始内容と終了内容を確認します。
「正規表現ツールを試す」をクリックします。
始める内容と終わる内容を入力して正規表現を生成し、設定を応用します。
「すべてにマッチ」にチェックを入れ、保存します。
Tips: スクレイピングされた画像URLはサムネイルURLです。フルサイズの画像URLが必要な場合は、ステップを追加してフィールドを再フォーマットする必要があります。 このチュートリアルをご確認ください: