正規表現ツール
フォローする任意の文字列を正規表現に検索できるため、テキストから部分文字列を探すとか、部分的に文字列を置き換えるとか、目的の文字列かどうか判定する機能も実行できます。
ここ
で正規表現の基本知識を知ることができます。

一、Octoparse正規表現ツールとは?
Octoparse正規表現ツールは、さまざまな条件を設定して、正規表現を自動的に生成するツールです。正規表現の作成方法についてほとんど知らない場合、Octoparse正規表現ツールを試してみてください。
二、正規表現ツールにアクセス方法
方法1:「データを再フォーマット」→正規表現ツールを試す
1)カスタマイズしたい「データフィールド」の右上の
ボタンをクリックします。


2)「データを再フォーマット」をクリックします。

3)「ステップを追加」をクリックして、「正規表現による置換」または「正規表現によるマッチング」をクリックします。

- 「正規表現による置換」
- 「正規表現によるマッチング」
方法2:サイドバーメニュー→正規表現ツール
・サイドバーメニューの下の「ツール」ボタン
をクリックして、正規表現ツールをクリックします。


三、正規表現ツールのメインインターフェース
正規表現ツールのメインインターフェースは、4つの部分で構成されています。

1)元の文字列
「データを再フォーマット」オプション内で正規表現ツールを開くと、抽出されたテキスト文字列がここに表示されます。
サイドバーメニューからクリックする場合は、入力または貼り付けにより、文字列をソーステキストに直接入力する必要があります。
2)自動生成/参考記事/サンプル
「自動生成」タブには、さまざまなオプションのチェックボックスがあります。これらのボックスをチェックし、ソーステキストのいくつかのパラメータを入力して、正規表現を自動的に生成できます。
「参考記事」タブをクリックして、W3Schoolsの正規表現のチュートリアルにアクセスすることができます。
「サンプル」タブをクリックして、W3Schoolsの例を確認することもできます。
3)正規表現
「自動生成」でパラメータを入力して「生成」をクリックすれば、「正規表現」ボックスで構文が自動的に生成されます。
すべてのテキストにマッチしたい場合は、「正規表現」で「すべてにマッチ」をオンにします。 次に、「マッチング」ボタンをクリックして、左の「マッチした文字列」でターゲットテキストを見つけたかどかを確認します。
4)マッチした文字列
右下の「マッチング」ボタンをクリックしてターゲットテキストが表示されます。
四、正規表現ツールの使い方
3つのステップだけで正規表現ツールを簡単に利用できます。実践してみましょう。
例として、以下の文字から、最初目の価格「18,306」を抽出するとしましょう。
「スカイチケット1 泊の合計1 泊の合計額(税、諸費用込み)1 泊の合計額(税、諸費用込み)滞在期間の合計額(税、諸費用込み)¥18,306¥18,306¥18,306¥18,306」
ステップ1:ソーステキストから必要なパラメーターを入力します。

「自動生成」ボックスに5つのオプションがあります。
「で始める」/「で終わる」
ボックスに入力した文字を含めないで、その文字からまたはその文字までの内容を抽出します。
「を含めて始める」/「を含めて終わる」
ボックスに入力した文字を含めて、その文字からまたはその文字までの内容を抽出します。
「を含める」
入力した文字を含む内容を抽出します。
ステップ2:正規表現を生成する
「自動生成」ボックスに必要なパラメータを入力してから、「生成」ボタンをクリックします。
ここでは最初目の価格「18,306」を抽出しますので、「で始める」ボックスに「)¥」、「で終わる」ボックスに「¥」を入力します。

ステップ3:正規表現を適用する
正規表現ボックスに構文ができましたら、「マッチング」をクリックします。
「マッチした文字列」ボックスに抽出したい内容が表示されたら、この正規表現は正確に記述と表します。
データを再フォーマットでツールを開く場合、「応用」をクリックすれば、正規表現を指定できます。
