時には、情報が非表示になっているため、最初にいくつかのアイテムをクリックする必要がある場合があります。たとえば、一部の電話番号は「Call」ボタンの背後に非表示になっているか、さまざまなタブに情報が非表示になっていることがあります。このようなデータをスクレイピングする方法はありますか?
以下のウェブサイトを例に取ります:https://furunavi.jp/Faq/Category/1
このWebサイトで、答えを表示する場合は、それぞれの矢印をクリックする必要があります。
全てのQ&Aを抽出したい場合、下記の2つの方法に従ってご操作ください
クリックステップを設定- Octoparseに目的アイテムをクリックして開くように指示する
ウェブページのソースコードにデータが表示されている場合は、直接データを抽出できる
1. クリックステップを設定- Octoparseに目的アイテムをクリックして開くように指示する
1~4の順で「Q」カードをクリックし、操作ヒントで「各要素にループクリック」を選択します。
「ループアイテム」の「基本設定」で、ループモードと要素のXpathを下記のように調整します
//div[@class='question-title']
「アイテムをクリック」の詳細設定でAJAXタイムアウトの時間を設定します。
「保存」をクリックして保存します。
「ループアイテム」をクリックし、「アイテムをクリック..」を押せば、答えが現れます。次は3〜4の順で質問と答えのテキストをクリックします。
2. ウェブページのソースコードにデータが表示されている場合は、直接データを抽出できる
ブラウズモードをオンにします。
手動で「Q」の部分をクリックして開きます。
ブラウズモードをオフにします。
他のテキスト情報と同様に、説明テキストをスクレイピングします。
この方法は、データがソースコードに表示されている場合にのみ機能します。情報がクリック後に表示される場合は、最初の方法を使用する必要があります。