データを再フォーマットする
フォローするOctoparseには、データをクリーンアップする方法がたくさん用意されています。例えば、文字列を置き換えたり、余分なスペースを削除したり、接頭辞/接尾辞を追加したり、文字列を正規表現でマッチングしたり、日付/時刻を再フォーマットしたりすることができます。データが要件を満たすまで、複数の方法でフィールドをクリーンアップできます。
どこで編集できるのか?
データプレビューで、クリーンアップするデータフィールドの「ほかのオプション」アイコンをクリックし、「データを再フォーマット」を選択します。
「ステップを追加」をクリックし、データをどのように処理するかを選択します。データが要件を満たすまで複数のステップを追加することができます。
再フォーマットの処理
1. 置換
抽出されたデータ内の特定の文字列を、新しい文字列で置き換えます。
2. 正規表現による置換
特定の正規表現を使って、抽出されたデータ内の一致した文字列を必要な文字列に置き換えます。
3. 正規表現によるマッチング
特定の正規表現を使って、抽出されたデータから一致する文字列を取得します。
4. スペースの削除
抽出されたデータの最初または最後から不要なスペースを削除します。
5. 接頭辞の追加
抽出されたデータの最初に文字列を追加します。
6. 接尾辞の追加
抽出したデータの最後に文字列を追加します。
7. 日時のフォーマット
抽出された日付/時刻を特定のフォーマットに変更します。
8.タイムスタンプの変換
タイムスタンプは、日付と時刻を記録するために使用される文字列、またはエンコードされたメッセージです。 タイムスタンプの変換を使って、文字列を正しい日時フォーマットに変更できます。また、日時を文字列に変更することもできます。
9. HTML
特定のHTMLタグをプレーンテキストに変換します。たとえば、 ">"を ">"に、 " "をスペースにトランスコードします。
ヒント! 正規表現で処理する場合は、正規表現ツールをよく利用しています。下記の記事をご参照ください。 |