Pythonにおける正規表現reのsearchの利用方法について現役エンジニアが解説【初心者向け】
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
この記事では、Pythonにおける正規表現のためのreモジュールのsearch関数の使い方について解説します。
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
Pythonにおける正規表現reのsearchの利用方法について詳しく説明していくね!
お願いします!
正規表現とは
まずは、「正規表現」について説明しておきます。
正規表現というのは文字列を検索するときなどに使われる文字列の表現方法で、プログラミングにおいても頻繁に用いられています。
例えば、大量の文章のなかから「〇〇市」という場所を表す名詞を検索したい場合や、「私は〇〇です。」というような形式の文字列を検索するときなどに用いられます。
reモジュールはPythonにおいて正規表現を使うことができるためのモジュールで、使い方がわかれば簡単に正規表現を用いた文字列検索ができます。
詳しくはこちらの記事を参考にしてください。
re.searchの使い方
reモジュールを使って正規表現を使った文字列検索を行なうには、search関数を用います。
search関数は文字列の中で正規表現に一番最初に一致する部分を取得できます。
search関数の使い方は、
re.search(正規表現文字列, 検索したい文字列)
です。
「正規表現文字列」というのは、簡単に言えば検索したい文字列の正規表現です。
search関数は検索結果をオブジェクトとして返すので、
検索結果を格納する変数 = re.search(正規表現文字列, 検索したい文字列)
として、検索結果を受け取る必要があります。
検索結果の入ったオブジェクトは、
検索した文字列中でヒットした部分の位置を取得することのできるstartメソッド、endメソッド、spanメソッド、
ヒットした文字列を取得するgroupメソッドがあります。
re.searchを利用して文字列データを検索してみよう
それでは、Pythonにおける正規表現を用いた文字列検索の方法を確認してみましょう。
# reモジュールのインポート >>> import re # 文字列を準備 >>> str = "I am learning Python." # 検索したい文字列を準備(ここが正規表現に当たります) >>> pattern = '[a-z]+ing' # serach関数で文字列を検索 >>> result = re.search(pattern, str) # 結果が格納されたオブジェクトを確認 >>> result 出力:<re.Match object; span=(5, 13), match='learning'>
# groupメソッドでヒットした文字列を表示 >>> result.group() 出力:'learning'
まとめ
この記事では、Pythonにおける正規表現を扱うためのreモジュールのsearch関数の使い方について解説しました。
自然言語処理などの人工知能でも使われいるので覚えておくと役に立つでしょう。
監修してくれたメンター
メンターSさん
システムエンジニアとしてこれまで行政システムや医療用システムの保守、開発に携わりました。 JavaやPython、PHP、Kotlinなど様々な言語での開発経験があります。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でも最短4週間でPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。