このガイドに抽出するデータ
商品関連
商品タイトル
商品URL
レビュー関連
総合点数
レビュー件数
投稿者
投稿時間
レビュータイトル
レビュー内容
例URL:
詳細ステップ
ステップ 1:アマゾンにログインし、Cookieを保存する
より完全なデータを取得するために、まずAmazonにログインします。以下は、ログイン後のCookieをタスクに保存する方法についての参考記事です。
ステップ2:対象商品のレビュー詳細ページを開く
商品の詳細ページにアクセスし、レビューの下部にある「すべてのレビューを参照します」をクリックします。
投稿されたすべてのレビューが表示されるページにアクセスしますので、このページの URLをコピーします。
ステップ 3:OctoparseにURLを貼り付ける
Octoparseを立ち上げたら、検索バーの中に先ほどコピーしたURLを貼り付けます。続いて「スタート」をクリックします。
ステップ4:自動検出機能よりワークフローを生成する
操作提案パネル内にある「 Webページのデータを自動検出」をクリックすると、画面の読み込みが始まります。
数秒経つと「検出完了」というメッセージが表示されます。
識別が完了すると、画面下部にデータフィールドが表示され、レビューがリスト化されます。このステップで必要ないフィールドを削除することができます。
確認後、「ワークフロー」を生成をクリックします。
ステップ5:商品関連データを追加する
各コメントを収集する前のステップにデータ収集の手順を追加します。
緑色エリアをクリックして、商品のタイトルとリンクを収集します。
続いて、点数とレビュー件数をクリックし抽出します。
ステップ 6:スクレイピングタスクを実行する
● ワークフロー上部にある「保存」と「実行」の順番にクリックします。
● ローカル抽出(無料)またはクラウド抽出(有料)を選択します。
● スクレイピングが開始されるので、完了するまで待ちます。
以下はデータのサンプルです。
Amazonレビュー以外の商品情報をスクレイピングしたい方は、こちらの記 事も合わせてご覧ください。