ASINコードは、Amazonグループの独自のコードで書籍以外の商品を識別する10桁の固有番号です。同じ商品は、どの国のamazonでも、同じASINコードで管理されています。ですから、ASINを知ってると、商品リサーチをする際に無駄な時間を奪われることが減るかもしれません。
今回の記事は、ASINコードと一致する商品をスクレイピングする方法を紹介します。始める前に、ASINのリストを用意しておく必要があります。
チュートリアルで次のURLを使用します。
以下はチュートリアルの主な手順です。
1)「Webページを開く」- 内蔵ブラウザで対象のWebページを開く
2)「ループアイテム」 - ASINのリストを入力し検索する
4) 抽出タスクを始める - タスクの実行を行いデータを取得する
1) 「Webページを開く」- 内蔵ブラウザで対象のWebページを開く
URLを入力して「抽出開始」をクリックし、ページを開きます。
2) 「ループアイテム」 - ASINのリストを入力し検索する
このステップでは、OctoparseがASINコードを1つずつ検索ボックスに自動的に入力するように設定します。
- ワークフローにマウスオーバーし、[+]ボタンをクリックし、「ループアイテム」を選択します。
- 「ループモード」の「テキストリスト」を選択し、入力ボタンをクリックし、ポップアップボックスにキーワードを1行ずつ入力します。
今、ASINリストがループアイテムボックスに表示されています。それでは検索操作のループを作り始めましょう。
- 検索ボックスをクリックし、「操作ヒント」の「テクストを入力する」をクリックします。
- 一番目のASINをテキストボックスに入力し、「はい」をクリックして保存します。
- ページの検索ボタンをクリックし、「操作ヒント」の「選択ボタンをクリックする」をクリックします。
- 生成された「テキストを入力」と「アイテムをクリック」アクションを「ループアイテム」の中にドラッグします。
- 「ループ内のテキストを入力する」にチェックを入れ、「保存」をクリックします。そうすると、ループアイテムにあるキーワードを繰り返して入力されます。
ヒント! テキストを入力する詳細について以下チュートリアルをご参考ください。 |
3) 「データを抽出する」 - 抽出したいデータを選択する
- 抽出したい情報をクリックし、「操作ヒント」の「選択した要素のテキストを抽出する」を選択します。
- 必要に応じて、フィールド名を変更します。
4) 抽出タスクを始める - タスクの実行を行いデータを取得する
「保存」と「実行」をクリックし、データを抽出します。以下はデータのサンプルです。