Pythonの正規表現の使い方を現役エンジニアが解説【初心者向け】
初心者向けにPythonの正規表現の使い方について現役エンジニアが解説しています。正規表現とは文字の連なり、組み合わせを表現するパターンで、特定の文字を使用します。複雑で柔軟な検索が出来るようになります。Pythonではreモジュールのmatch、searchメソッドを使用します。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
Pythonの正規表現の使い方について解説します。
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
Pythonの正規表現の使い方について詳しく説明していくね!
お願いします!
正規表現とは
正規表現とは文字の連なり、組み合わせを表現するパターンです。
特定のパターンに合致する文字列を検索するのに頻繁に用いられます。
例えば、以下の正規表現を見てください。
d{3}
dは数字、{3}は3回の繰り返しなので、この正規表現は「数字3個」を示します。
reモジュールとは
reモジュールとはPythonで正規表現を扱うためのモジュールです。
文字列が正規表現にマッチするか判定したり、マッチした箇所を抽出や置換したりできます。
正規表現は便利な反面、複雑になりがちです。stringモジュールにも文字列操作に便利なメソッドが多数あるので、適宜使いわけます。
Pythonの正規表現の使い方の手順
reモジュールでよく使うのはmatchとsearchメソッドです。
matchは文字列の先頭で正規表現とのマッチングを行います。
一方、searchは文字列中の任意の位置で正規表現とのマッチングを行います。用途に応じて使いわけます。
1つ目の使い方は、以下のように一旦正規表現オブジェクトをコンンパイルするものです。
regex = re.compile(pattern) regex.match(string) regex.search(string)
2つ目の使い方は、以下のように直接re.match, re.searchメソッドを呼び出すものです。
re.match(pattern, string) re.search(pattern, string)
同じ正規表現を繰り返し使う場合には、前者の方が効率的です。一回限りの場合には、後者の方がソースコードが簡潔になります。
詳細は公式のリファレンスを参照してください。
実際に書いてみよう
サンプルコード
import re regex = re.compile('d{3}-d{4}') print(regex.match('123-4567')) print(regex.match('0123-456-789'))
実行結果
<_sre.SRE_Match object; span=(0, 8), match=’123-4567′>
None
解説
1行目でreモジュールをインポートしました。
3行目で正規表現オブジェクトをコンパイルしました。数字3個、ハイフン、数字4個にマッチします。
5,6行目で文字列とのマッチングを行いました。
5行目の例ではマッチするため、Matchオブジェクトが返りました。現実には、この後でMatchオブジェクトに対して何らかの処理を行います。
6行目の例ではマッチしないため、Noneが返りました。
監修してくれたメンター
橋本紘希
システムインテグレータ企業勤務のシステムエンジニア。 開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。