YouTubeから動画情報をスクレイピングする
フォローするこのチュートリアルでは、YouTubeから動画情報をスクレイピングする方法を紹介します。
方法一:Octoparseタスクテンプレート
1.Octoparseのメイン画面の[タスクテンプレート]に移動
2.YouTubeテンプレートを選ぶ
3.テンプレートを使う
[今すぐ使う]⇒検索キーワード入力⇒[保存して実行する]⇒[ローカル抽出]/「クラウド抽出]を選ぶ
方法二:Octoparseカスタマイズモード
以下はチュートリアルの主な手順です。 [タスクファイルをダウンロードする]
1. 「Webページを開く」 - 内蔵ブラウザで対象のWebページを開く
3. 無限スクロールダウンを設定する - 新しく増えてきたデータを取得する
4. 「ループアイテム」を作る - 抽出したいデータをループに入れる
5.データカスタマイズ - フィールド削除・フィールド名編集
6. 抽出タスクを始める - タスクを実行してデータを取得する
タスク作成の仕方は以下のビデオでもご参考になれると思います。
1.「Webページを開く」 - 内蔵ブラウザで対象のWebページを開く
- Octoparseのメイン画面の[カスタマイズモード]に移動します。
- URLを入力して「URLを保存する」をクリックします。
2.「テクストを入力する」 – 検索キーワードを入力する
- 入力ボックスを左クリックして、「操作ヒント」の「テクストを入力する」をクリックします。
- 検索キーワードを入力して、「OK」をクリックします。
- 「検索」ボタンをクリックし、「操作ヒント」の「ボタンをクリックする」をクリックします。
3. 無限スクロールダウンを設定する - 新しく増えてきたデータを取得する
- [アイテムをクリックする]のカスタマイズ設定で「スクロールダウン」のチェックボックスにチェックを入れます。
- 「スクロール回数」「間隔」「方法」を自由に選択します。ここでは「10回」「2秒」「ページの最後までスクロール」を設定します。
ヒント! YoutubeはAjaxと無限スクロールが使われたサイトで、このようなサイトに対応する方法はこちらのビデオ |
4.「ループアイテム」を作る - 抽出したいデータをループに入れる
- マウスを1番目と2番目のビデオ情報のところに移動し、全体が青色の四角枠に囲まれた後にクリックします。
- 操作ヒントの「全てのサブ要素を選択する」をクリックします。
- 1番目のビデオの情報が全て選択され、残りの他のビデオも識別され、「全て選択」と「選択したデータを抽出する」を順番にクリックします。
5.データカスタマイズ - フィールド削除・フィールド名編集
- いらないフィールドを削除して、フィールド名を編集します。

6. 抽出タスクを始める - タスクを実行してデータを取得する
- タスク作成画面で一番左上の「保存する」をクリックします。
- それから、その右の「抽出開始」をクリックします。
- [ローカル抽出]/「クラウド抽出]を選びます。
以下のように、無事にデータが抽出できました。
この記事は役に立ちましたか?もしご不明な点がございましたら、いつでもお問い合わせください!