レッスン5:データを取得する
フォローする前回では、初めてのスクレイピングタスクを作成しテストしました。このレッスンでは、タスクを実行して実際のデータを抽出しましょう!
1. データを取得する方法
タスクを実行するには2つの方法があります。
- ローカル抽出(ご自分のパソコンで実行する)
- クラウド抽出(クラウドサーバーで実行する)
ご自分パソコンでタスクを実行する場合、抽出中にOctoparseアプリを開く必要があります。 ブラウザと実行ログから抽出状況が確認できます。
一方、クラウドでタスクを実行すると、タスクはOctoparseクラウドプラットフォームで実行されます。つまり、Octoparseアプリまたはパソコンをシャットダウンして、抽出が完了したらデータをチェックすることができます。ローカル抽出と比べると、クラウドで実行されるタスクは、通常6倍~20倍速くなります。クラウド抽出は有料機能で、料金プランをご参照ください。
2. 実行を開始する
タスクの作成が完了したら、「実行」ボタンをクリックして実行を開始できます。
または、ダッシュボードでタスクを見つけ、タスクを実行/停止することもできます。
3. データを確認する
タスクの実行が完了したら、データを確認することができます。
ダッシュボードでタスクを見つけ、表示されるデータ件数をクリックすると、データプレビュー画面に移動します。
または、ダッシュボードの「そのほか」アイコンをクリックし、「データプレビュー」で「ローカルデータ」と「クラウドデータ」のどちらを表示するかを選択することもできます。
4. データをエクスポートする
データに問題がなければ、データビュータブの右下隅にある「エクスポート」をクリックして、データをエクスポートすることができます。 Octoparseは、Excel、CSV、HTMLファイル、またはデータベースへのエクスポートをサポートしています。
データ範囲の指定について
クラウドデータをエクスポートするとき、 データ範囲を指定する必要があります。デフォルトは「すべてのデータ」です。
すべてのデータ:クラウドサーバーに保存されているすべてのデータです。
エクスポートされないデータ:タスクが複数回で実行された場合で使います。例えば、昨日抽出されたデータは昨日でエクスポートされたが、今日実行すると新しいデータが抽出され、今日の分をエクスポートするには、「エクスポートされないデータ」を選択することができます。
- ローカルデータは、複数回で抽出されたデータは全部保存されます。また、実行されたデバイスでのみチェック・ダウンロードできます。
- クラウドデータは、複数回で抽出されたデータは全部保存されます。アカウントにログインしている限り、どのデバイスからでもチェック・ダウンロードできます。
- クラウドデータは3か月間のみ保存され、その後クラウドサーバーから削除されます。自動削除される前に、必ずエクスポートしてください。
次へ
レッスン6:定期実行をスケジュールする