オーダーメイドコース
icon
icon

Pythonで正規表現を利用して電話番号を取得する方法を現役エンジニアが解説【初心者向け】

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

Pythonによるリストからインデックスを取得する方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonで画像ファイルをPDF化する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

目次

 

正規表現とは

正規表現の定義は、「いくつかの文字列を一つの形式で表現するための表現方法」です。正規表現を利用すれば、たくさんの文章の中から容易に見つけたい文字列を検索することが可能です。

 

[PR] 未経験からWebエンジニアを目指す方法とは

正規表現のメタ文字について

「いくつかの文字列を一つの形式で表現するための表現方法」です。その「一つの形式で表現するため」に、いくつかのある文字に対して特別な意味を与えています。その特別な文字のことをメタ文字と呼びます。

以下に述べる文字がその役割を担っています。

.   ^   $   [   ]   *   +   ?   |   (   )

.  -> 任意の一文字です。
^  -> 行の先頭を意味します。
$  -> 行の最後尾を意味します。
[] -> []の中に範囲などを指定します。 
*  -> 任意の文字数
+  -> 直前の文字の1回以上の繰り返し
?  -> 直前の文字は省略可能
|  ->  論理和です。
() ->  ( )内を1文字扱い

電話番号を取得するための正規表現

電話番号を検索でヒットさせるには正規表現をどのように記述すればよいでしょうか?例として 以下の番号を検索でヒットさせてみましょう。

12-3456-7899
33-5678-7777
44-1283-9812

電話番号をテキストファイルから検索してヒットするような正規表現を考えてみましょう。

まず、上の電話番号をみて思うのは、数字が2つ続く、その次にハイフン(-)、そしてその次に数字が4つならび、またハイフン(-) そしてその後に数字が4つ続きます。

 

実際に書いてみよう

正規表現で数字1文字を表現するには[0-9]を使用します。上記の電話番号を正規表現で表すと

[0-9][0-9]-[0-9][0-9][0-9][0-9]-[0-9][0-9] [0-9][0-9]

となりますね。

 

まとめ

テキスト処理において正規表現はUNIXと共に存在してきた伝統的な存在です。計算機科学とも相性の良い歴史を感じつつ今なお強力なツールです。是非習得しましょう

 

監修してくれたメンター

坂下雄一(さかしたゆういち)

フリーランスのエンジニア、飲食業経営
エンジニア経歴:EDAの自動化環境、テスト環境構築。組み込みマイコンプログラミング(車載、インフラ系):医療用DB、登録自動化、患者管理システム等

飲食店経営:ラオスはルアンパバーン、フィリピンのセブで寿司屋、ラーメン屋を経営。
現在バンコク在住。コワーキングスペースのハシゴが職場環境。ムエタイとタイ語とゴルフを絶賛習得中。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。