Webページから複数の画像を抽出する方法
フォローする一般に、Octoparseを使用してWebページから複数の画像を抽出するには3つの方法があります。
方法1:画像をクリックしてURLを直接抽出する
- 一番目の画像をクリックします。
- 「操作ヒント」から「選択した画像のURLを抽出する」をクリックします。
- 上記の手順を繰り返して、他の画像のURLを取得できます。
ご注意:画像をクリックすると、「操作ヒント」の下部にあるタグは「IMG」になります。
「IMG」タグではない場合、タグを修正する必要があります。
抽出したデータのフォーマットは以下のようになります。
方法2:画像のURLをループで抽出する
image1、image2、image3などをクリックして、目的のすべての画像を選択し、「操作ヒント」から「選択した画像のURLを抽出する」をクリックします。画像のループアイテムが自動的に生成されます。
抽出したデータのフォーマットは以下のようになります。
方法3:ソースコードから画像URLを取得する
セル内ですべての画像を抽出する必要がある場合は、RegExpツールを使用して、HTMLからすべての画像URLを取得できます。 下から詳細を確認してください。
- 画像の部分を一緒に選択します。
- 操作ヒントからの「選択した要素の外部HTMLを抽出する」をクリックします。
- RegExpツールで画像URLを取得します。
RegExpツールの使い方は以下の記事をご参照ください。
抽出したデータのフォーマットは以下のようになります。