Javaの正規表現のエスケープ処理について現役エンジニアが解説【初心者向け】
初心者向けにJavaの正規表現のエスケープ処理について解説しています。最初にPatternクラスとMatherクラスを使った正規表現の扱い方とエスケープ処理の基本の書き方を説明します。次に正規表現のエスケープ処理を実装する方法をサンプルコードで見ていきましょう。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
Javaの正規表現のエスケープ処理について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。
そもそもJavaについてよく分からないという方は、Javaとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプJava講座の内容をもとに作成しています。
今回は、Javaに関する内容だね!
どういう内容でしょうか?
正規表現のエスケープ処理について詳しく説明していくね!
お願いします!
目次
正規表現のルールとは
正規表現とは文字列のパターンを一つの形式でまとめて表現するために使うものです。郵便番号や電話番号などを表すことができ任意の文字列から特定の文字列を取得したり、一致しているかを判定したりする際に使います。
正規表現を作成する時には以下のルールがあります。
- 以下に示す特殊文字を使用する
- 特殊文字以外の文字は、その文字自体を照合する
- 大カッコ([])で囲まれた文字セットは、そのセット内の任意の文字を照合する 1文字の正規表現を表します。例えば[abc]と記述すればaもしくはbもしくはcと一致することを表します
正規表現の特殊文字及び記号には以下のようなものがあります。
特殊文字及び記号 | 記号の説明 |
---|---|
. | 任意の1文字。改行文字は除く。 |
* | 直前の1文字の0回以上の繰り返しと一致 |
^ | 行の先頭 |
$ | 行の末尾 |
[ ] | カッコ内の任意の1文字と一致。「-」で範囲指定可。 |
[^ ] | カッコ内の任意の1文字と不一致。「-」で範囲指定可。 |
+ | 直前の文字の1個以上の繰り返しと一致 |
? | 直前の文字が0個または1個の場合に一致 |
{ } | カッコ内の数値の繰り返しと一致 |
| | 直前、直後どちらかのパターンに一致 |
Javaで正規表現を扱う方法
Javaで正規表現を使うためには以下のように記述します。
Pattern Patternの変数 = Pattern.compile(正規表現); Matcher Matcherの変数 = Patternの変数.matcher(比較対象文字列);
java.util.regexパッケージにあるPatternクラスとMatherクラスを使うことで正規表現を使って処理をすることができます。
最初にPatternクラスをcompileクラスの引数に正規表現を設定することで正規表現を使用する準備をします。
次に先ほど作成したPatternクラスのオブジェクトからmatcherメソッドを呼び出し、引数として正規表現を使って調べたい文字列を設定します。戻り値としてMatcherクラスのオブジェクトを返すためMatherクラスの変数を用意しておきます。
matcherメソッドを使うことで文字列を正規表現に一致する部分に分けることができるため一つの文字列の中に複数正規表現に一致する場合でも調べることができます。
エスケープ処理とは
特殊文字を使うことで正規表現を表すことができます。しかし、特殊文字を正規表現としてではなく、文字として表したい時にはエスケープ処理をする必要があります。
エスケープ処理は以下のようにします。
特殊文字
「」を前に付けることで正規表現としての特殊文字ではなく、普通の文字として扱うことができます。
しかし実際には「」は文字列において特殊な意味を持つため「」に対してもエスケープ処理が必要になるため
特殊文字
という形で記述します。
正規表現のエスケープ処理を実装してみよう
では正規表現のエスケープ処理を実装してみましょう
ソース
import java.io.IOException; import java.io.IOException; import java.util.regex.Matcher; import java.util.regex.Pattern; public class MainClass { public static void main(String[] args) throws IOException { String str01 = "..."; String str02 = ".da.fb.rd"; Pattern p = Pattern.compile(str01); Matcher m = p.matcher(str02); while (m.find()) { System.out.println(m.group()); } } }
実行結果
.da .fb .rd
まとめ
この記事ではJavaで正規表現のエスケープ処理について解説しました。
監修してくれたメンター
メンターSさん
システムエンジニアとしてこれまで行政システムや医療用システムの保守、開発に携わりました。 JavaやPython、PHP、Kotlinなど様々な言語での開発経験があります。 TechAcademyではJavaコース、Pythonコース、AIコースなど7コースを担当しています。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもJavaやServletの技術を使ってWebアプリケーション開発を習得できるオンラインブートキャンプJava講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。