YouTubeから動画情報をスクレイピングする
フォローするこのチュートリアルでは、YouTubeから動画情報をスクレイピングする方法を紹介します。
方法一:Octoparseタスクテンプレート
1.Octoparseのメイン画面の「タスクテンプレート」に移動
2.YouTubeテンプレートを選ぶ
3.テンプレートを使う
[今すぐ使う]⇒パラメーター入力⇒「今すぐ使う]⇒「ローカル抽出」/「クラウド抽出]を選ぶ
方法二:Octoparseカスタマイズモード
以下はチュートリアルの主な手順です。 [タスクファイルをダウンロードする]
1. 「Webページを開く」 - 内蔵ブラウザで対象のWebページを開く
2. 無限スクロールダウンを設定する - 新しく増えてきたデータを取得する
3. 「ループアイテム」を作る - 抽出したいデータをループに入れる
4.データカスタマイズ - フィールド削除・フィールド名編集
5. 抽出タスクを始める - タスクを実行してデータを取得する
1.「Webページを開く」 - 内蔵ブラウザで対象のWebページを開く
- コピーしたURLを入力ボックスに貼り付けて、タスクを作ります。 自由度の高い「カスタイズタスク」は、複雑なウェブサイトを対応できます。
- 「抽出開始」をクリックします。
- 「ワークフロー」をオンにするとタスクの作りはやすくなります。
2. 無限スクロールダウンを設定する - 新しく増えてきたデータを取得する
- [Webページを開く]の「Webページの読み込み後」で「スクロールダウン」のチェックボックスにチェックを入れます。
- 「スクロール回数」「間隔」「方法」を自由に選択します。ここでは「20回」「2秒」「一番下までスクロール」を設定します。
ヒント! YoutubeはAjaxと無限スクロールが使われたサイトで、このようなサイトに対応する方法はこちらのビデオ |
3.「ループアイテム」を作る - 抽出したいデータをループに入れる
- マウスを1番目と2番目のビデオ情報のところに移動し、全体が青色の四角枠に囲まれた後にクリックします。
- 操作ヒントの「全てのサブ要素を選択する」をクリックします。
- 1番目のビデオの情報が全て選択され、残りの他のビデオも識別され、「データを抽出する」を順番にクリックします。
4.データカスタマイズ - フィールド削除・フィールド名編集
- いらないフィールドを削除して、フィールド名を編集します。

5. 抽出タスクを始める - タスクを実行してデータを取得する
- タスク作成画面で一番左上の「保存」をクリックします。
- それから、その右の「実行」をクリックします。
- 「ローカル抽出」/「クラウド抽出」を選びます。
以下のように、無事にデータが抽出できました。
この記事は役に立ちましたか?もしご不明な点がございましたら、いつでもお問い合わせください!