Octoparseは、AJAX、JavaScript、およびその他の動的なウェブサイトを含む、ほとんどのウェブサイトのスクレイピングをサポートしています。また、Octoparseではフォーム、ドロップダウンリスト、無限スクロールなど、さまざまな要素と対話することも容易です。
一般的なルールとして、コピー&ペーストできるデータや情報は、Octoparseを使用してスクレイピングすることができます。具体的には、目的のデータがウェブサイトのHTMLソースコード内に存在する場合(ウェブページ上には表示されていなくても)、Octoparseを使用してスクレイピングすることができます。
1. ウェブページ上に表示される要素:
テキスト
画像のURL
リンク(URL)
インナー/アウターHTMLコード
属性値
詳細については、こちらをご覧ください:テキスト/URL/画像/HTML/属性値を抽出する方法
2. Octoparseでスクレイピングできるソースコードに隠された情報:
ページのURL
ページのタイトル
メタデータ
HTMLソースコード
現在の時刻
詳細については、こちらをご確認ください:
複雑なウェブサイトからのデータスクレイピングが時間がかかる場合や、ビジネスの最大限の成果に集中したい場合は、弊社のデータサービスをご利用いただくためにお問い合わせください。