Pythonで正規表現を利用して電話番号を取得する方法を現役エンジニアが解説【初心者向け】
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
Pythonによるリストからインデックスを取得する方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。
Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
Pythonで画像ファイルをPDF化する方法について詳しく説明していくね!
お願いします!
目次
正規表現とは
正規表現の定義は、「いくつかの文字列を一つの形式で表現するための表現方法」です。正規表現を利用すれば、たくさんの文章の中から容易に見つけたい文字列を検索することが可能です。
正規表現のメタ文字について
「いくつかの文字列を一つの形式で表現するための表現方法」です。その「一つの形式で表現するため」に、いくつかのある文字に対して特別な意味を与えています。その特別な文字のことをメタ文字と呼びます。
以下に述べる文字がその役割を担っています。
. ^ $ [ ] * + ? | ( ) . -> 任意の一文字です。 ^ -> 行の先頭を意味します。 $ -> 行の最後尾を意味します。 [] -> []の中に範囲などを指定します。 * -> 任意の文字数 + -> 直前の文字の1回以上の繰り返し ? -> 直前の文字は省略可能 | -> 論理和です。 () -> ( )内を1文字扱い
電話番号を取得するための正規表現
電話番号を検索でヒットさせるには正規表現をどのように記述すればよいでしょうか?例として 以下の番号を検索でヒットさせてみましょう。
12-3456-7899 33-5678-7777 44-1283-9812
電話番号をテキストファイルから検索してヒットするような正規表現を考えてみましょう。
まず、上の電話番号をみて思うのは、数字が2つ続く、その次にハイフン(-)、そしてその次に数字が4つならび、またハイフン(-) そしてその後に数字が4つ続きます。
実際に書いてみよう
正規表現で数字1文字を表現するには[0-9]を使用します。上記の電話番号を正規表現で表すと
[0-9][0-9]-[0-9][0-9][0-9][0-9]-[0-9][0-9] [0-9][0-9]
となりますね。
まとめ
テキスト処理において正規表現はUNIXと共に存在してきた伝統的な存在です。計算機科学とも相性の良い歴史を感じつつ今なお強力なツールです。是非習得しましょう
監修してくれたメンター
坂下雄一(さかしたゆういち)
フリーランスのエンジニア、飲食業経営 飲食店経営:ラオスはルアンパバーン、フィリピンのセブで寿司屋、ラーメン屋を経営。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でも、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。
また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。