こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
「クリック」は、必要なデータを取得するためにタスクを設定する際に、ワークフローで最も一般的に使用されるステップの1つです。その動作は、ブラウザのウェブページ上のどこかをクリックするかのようなクリックアクションをシミュレートすることができます。
「アイテムをクリック」以外にも、ワークフローで他の名前もあります。
「次のページをクリック」: ページネーションのステップを設定すると自動的に生成されます。
ワークフローに「クリックアイテム」を追加する方法は?
1. 「アイテムをクリック」は、単にウェブページ上の任意の要素をクリックすることで生成できる
主な使われ方は以下の通りです:
クリックでデータが表示される
検索ボタン
ページ上の任意の要素をクリックし、操作提案から「クリック」関連の選択肢を選択します。以下は例としてのスクリーンショットです。
2. ワークフローから追加する
また、ワークフローパネルから直接追加する方法もあります。
次に、この「アイテムをクリック」アクションの設定で、クリックする必要のある要素のXPathを入力する必要があります。これにより、どのボタンをクリックするかがわかるようになります。
「アイテムをクリック」をクリックします。
要素のXPathを直接入力します。(要素のXPathを知っている場合)
保存するために「保存」をクリックします。
ヒント: XPathの書き方については、このチュートリアルを参照してください: XPathとは何か、Octoparseでの使用方法
XPathの書き方がわからない場合は、以下の方法を通して対処できます:
XPath生成ボタンをクリックします。
ウェブページからクリックしたい要素を選択し、OctoparseがXPathを自動的に生成します。
3. 自動検出
自動検出機能を使用してワークフローを生成する場合、まずリストデータが抽出されます。しかし、リスト内のアイテムをクリックして詳細ページを開く必要がある場合はどうすればよいでしょうか?詳細については、このチュートリアルを参照してください: リス詳細ページに移動してデータを抽出する
アイテムをクリックを設定する
時には、「アイテムをクリック」の設定を調整する必要があります。アイテムをクリックをクリックして設定を開くことができます。
1. XPathの修正
ここで、クリックする要素のXPathを修正することができます。「タグ」と「テキスト」は、現在クリックする要素を示しています。
時には、アイテムをクリックがクリックアクションを実行しない場合があります。それは、ウェブサイトがページのレイアウトを更新したために、XPathが無効になっている可能性があります。その場合、XPath生成ボタンをクリックしてXPathを更新するか、独自に書き直す必要があります。
2. 詳細設定
ウェブサイトがページの読み込みに時間がかかる場合、クリックアクションを実行する前に待機時間や条件を追加することができます。
「新しいタブで開く」は、ブラウザと同様にページを新しいタブで開くことができます。
「AJAX読み込み」は、AJAX読み込みページの処理に使用されます。
ページを開いた後のページスクロールをシミュレートするために、ページが読み込まれた後にページをスクロールダウンさせることもできます。
3. 再試行
特定の条件に基づいてOctoparseにウェブページを再読み込みさせることができます。詳細な設定については、こちらの「再試行」ガイドをご覧ください。
4. 相対XPathと絶対XPath
ループアイテム内にあるアイテムをクリックの設定を確認すると、「相対XPath」と「絶対XPath」というオプションがあることに気付くかもしれません。これらのXPathオプションは、アイテムをクリックがループ内にある場合にのみ表示されます。ループアイテム内の各アイテムをクリックする必要がある場合は、相対XPathを選択することをお忘れないでください。2つのXPathオプションの違いについては、こちらで確認できます。