ファイルダウンロード
フォローするOctoparseを使用し、スクレイピング中ファイルや画像をダウンロードする方法を紹介します。
ターゲットサイト:https://www.aozora.gr.jp/cards/000148/card789.html
1.ダウンロードしたいドキュメントを一つ選択すると、選択した要素が緑色に、類似した要素が赤色に変わります。
2.操作ヒントから「すべて選択」をクリックすると、すべてのリンクが識別され、選択されると緑色に変わります。
3.「選んだファイルリンクを抽出し、ダウンロード]をクリックすると、リンク先を抽出するとともに、ファイルをローカルフォルダーにダウンロードします。
現在、データフィールドは以下のように表示されます。
4.ダウンロードファイルの名前を変更する
次4つの命名規則があります。
- 元ファイルMD5:MD5の値を使ってファイル名を付ける
- 元ファイル名:デフォルトのオリジナルファイル名
- 抽出時間:ダウンロード完了時間をファイル名に使用します
- フィールド値:関連フィールド値を使用します
また、ファイル名がすでに存在する場合は、3つのオプションから選択することができます。
- ダウンロードスキップ:現在ダウンロードされているファイルを保存しません。
- 元ファイルを上書きする: 既存のファイルを新しいダウンロードしたファイルで置き換えます。
- 自動変更:ファイル名の末尾に(1)を付けて、ファイル名を変更します。
5.フィールド右上の アイコンをクリックして、「データタイプを設定」の「リンクのURL(Aタグのhref属性)」を選びます。
注意:保存先フォルダーアイコンがあるフィールドを削除すると、ダウンロード設定がキャンセルされます。