URLの一括インポート
フォローするURLを一括してインポートするには、次の3つの方法があります(最大100万件のURL):
ヒント! インポート/生成されたURLの数が100万に達すると、Octoparseはすぐにインポート/生成を停止します。 |
以下のファイル形式からURLをインポートできます。
- CSV
- TXT
- Excel (.xlsx & .xls)
· 「カスタマイズタスク」をクリックし、新しいタスクを作る
· 「ファイルからインポート」を選択する
· 「ファイルを選択」をクリックし、インポートするURLを含むファイルを選択する
OctoparseはファイルからすべてのURLを自動的に識別してインポートします。ソフトに負担をかけないために最初の100件のURLのみが表示されます。
· 「保存」をクリックしてインポートを完了する
2. 別のタスクからURLをインポートする
この機能により、URL抽出を別のタスクと別々に行う必要がある場合に、2つのタスクをシームレスに統合することができます。余分なURLのエクスポートとインポートは不要です。
·「カスタマイズタスク」をクリックし、新しいタスクを作る
· 「タスクからインポート」を選択する
· ターゲットURLを含むタスクを選択し、適切なデータフィールドを指定する
· 「保存」をクリックしてインポートを完了する
選択したタスクは親タスクと呼ばれ、URLをインポートしたタスクは子タスクとなります。Octoparseはこの2つのタスクを連結させて実行します。
2つのタスクを連結させるには親タスクをクラウドでデータを取得しなければなりません。
親タスクでクラウドでデータが取得できたことを確認してから、親タスクのフィールドを選択します。
- 関連付けられた実行
子タスクを実行するように設定すると、抽出を開始する基準を指定できます。
· タスク構成インターフェースの「実行スケジュール」をクリックするか、ダッシュボードの「そのほか」をクリックする
· 「スケジュール設定」を選択する
選択肢は4つあります。
· 親タスクにURLを抽出するとすぐに子タスクを実行する場合は、「親タスクが開始したらすぐにタスクを実行する」を選択します。
ヒント! 1. 親タスクの設定から任意のオプションを選択して関連する実行を設定すると、両方のタスクがOctoparse クラウドサービス 2. 関連する実行が設定されている場合、子タスクの実行にはタスクスケジュール |
関連記事:
テーブルデータを抽出する