Pythonのreモジュールのsub関数について現役エンジニアが解説【初心者向け】

初心者向けにPythonのreモジュールのsub関数について現役エンジニアが解説しています。reモジュールとは、正規表現を扱うためにPythonに用意されている標準モジュールです。sub()関数は文字列を置換するための関数です。引数には置き換えたい文字列と検索対象の文字列を指定します。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

Pythonのreモジュールのsub関数について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonのreモジュールのsub関数について詳しく説明していくね!

大石ゆかり

お願いします!

 

目次

  1. reモジュールとは
  2. sub関数の使い方
  3. 実際に書いてみよう
  4. まとめ

 

reモジュールとは

reモジュールとは、「正規表現(regular expression)を扱うためにPythonに用意されている標準モジュール」です。

正規表現を使うと、任意のパターンの文字列を扱うことができて非常に便利です。正規表現はエンジニアにとって必須の知識となります。

[PR] Pythonで挫折しない学習方法を動画で公開中

sub関数の使い方

sub()関数は文字列を置換するための関数です。

第一引数には「この文字列に置き換えたい」という文字列を、第二引数には検索対象の文字列を渡します。戻り値は置換後の文字列全体です。

実際に書いてみよう

先ほどの説明だけだとまだわかりにくいので、実際にsub()関数を使ってみましょう。まずはコードの概要を簡単にご説明します。

  1. reモジュールをインポート
  2. 置換したいテキストを準備
  3. compile()により正規表現オブジェクトを作成
  4. テキストからパターンを探し出して置換

この例ではテキストの中から” Mr. 〇〇”という文字列パターンを探して、” Ms. Green”に置き換える処理をしています。

サンプルコード

import re

text = "Nice to meet you. Mr. Mike."

regex = re.compile(r"Mr. w+")

new_text = regex.sub("Ms. Green", text)

print(new_text)

出力結果

Nice to meet you. Ms. Green.

 

挨拶をする相手の名前を変えることができましたね。ここで、以下の部分が少し難しいと思うので詳しく説明します。

regex = re.compile(r"Mr. w+")

このコードのcompile()の引数に使われているwは任意の1文字(スペースやタブなどは含まない)を表しています。また、その後の+は1回以上の繰り返しを意味します。なので、w+と記述することにより、1文字以上の繰り返しを意味します。

つまり、”Mr. 〇〇”という文字列パターンを探しているわけですね。

ちなみに引数の先頭に付いているrはrow文字列を表します。row文字列とは、「エスケープされない文字列」のことです。

正規表現では頻繁にを用いるので、row文字列にしてエスケープを防ぐのが一般的です。仮にrow文字列にしなかった場合、\でマークを記述しなければならなくなるので、\w+と書かなくてはなりません。見やすさのためにもrow文字列を使うことをオススメします。

※macOSではではなく(バックスラッシュ)なので注意してください。

コラム

実は私も!?独学で損する人の特徴

「スクールは高いから独学で成功する」という気持ちの方は多いと思います。
もちろんその方が金額は低く抑えられるでしょう。
ただ 独学には向き不向きがあり、実はスクールが向いている人も大勢います。

そんな方のために参考として、 テックアカデミー卒業生がスクールを選んだ理由 をご紹介します。

  • ・困って挫折しそうなときに、質問や相談できる相手がいる環境で学んでいきたいなと思った
  • ・わかった気になっているだけだったので、自分を追い込む環境に置いた方がいいと感じた
  • ・スクールのカリキュラムで市場に求められるスキルを学ぶべきと思った

少しでも当てはまる部分があれば、 スクールが向いているかもしれません。
お試しのつもりで、まずは一度 無料相談 に参加してみませんか?

現役エンジニア・デザイナーに何でも気軽に相談できる30分すべて無料で できます。
無理な勧誘は一切ない ので、お気軽にご参加ください。

今なら相談した方限定の割引・参加特典付き! 無料相談はこちら

まとめ

この記事ではPythonのreモジュールのsub関数の使い方についてご紹介しました。

冒頭でも述べましたが、正規表現はエンジニアにとって必須の知識です。使いこなせるのと使いこなせないのとでは作業効率が全然違いますので、絶対に使いこなせるようになりましょう。

監修してくれたメンター

柴山真沙希(しばやままさき)

大手IT企業などでエンジニアとして2年ほど勤務した後、個人事業主としてプログラミングスクール「エンペサール」を経営。子供から大人まで幅広い層を対象にプログラミングを教えている。

得意言語はPython, HTML, CSSで、機械学習やデータ分析、スクレイピングなどが得意。サッカー観戦や読書が趣味である。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。

初心者・未経験でもできる。まずはテックアカデミーに相談しよう

プログラミングを独学していて、このように感じた経験はないでしょうか?

  • ・調べてもほしい情報が見つからない
  • ・独学のスキルが実際の業務で通用するのか不安
  • ・目標への学習プランがわからず、迷子になりそう

テックアカデミーでは、このような 学習に不安を抱えている方へ、現役エンジニア講師とマンツーマンで相談できる機会を無料で提供 しています。
30分間、オンラインでどんなことでも質問し放題です。

「受けてよかった」と感じていただけるよう 厳しい試験を通過した講師 があなたの相談に真摯に向き合います。

「ただ気になることを相談したい」
「漠然としているがプロの話を聞いてみたい」

こんな気持ちでも大丈夫です。

無理な勧誘は一切ありません ので、まずはお気軽にご参加ください。
※体験用のカリキュラムも無料で配布いたします。(1週間限定)

今なら参加者限定の割引特典付き! 無料相談を予約する