Pythonで文字列から数字だけ抽出する方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonで文字列から数字だけ抽出する方法について現役エンジニアが解説しています。正規表現とは、ある特定のパターンを持つ文字列を指定する表記法で検索や置換、抽出などを行う際に使います。Pythonではreモジュールのメソッドを使います。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

Pythonで文字列から数字だけ抽出する方法について解説します。

そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonで文字列から数字だけ抽出する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

正規表現とは

正規表現とは、ある特定のパターンを持つ文字列を指定する表記法の1つです。文字列の検索や置換、抽出などを行う際に用います。

プログラムで大量のテキストを一括処理する際に頻出の技法です。
 

reモジュールで文字列を検索する

Pythonで正規表現を使うにはreモジュールが便利です。

1つ目の使い方はあらかじめ正規表現をコンパイル(前処理)しておく方法です。正規表現を繰り返し使う場合には、効率が良いです。
 

regex = re.compile(pattern)
result = regex.search(string)

 

2つ目の使い方は直接re.searchメソッドを使う方法です。正規表現を1回だけ使う場合などは、こちらの方が簡易です。
 

result = re.search(pattern, string)

 
reモジュールの詳細な用法は公式リファレンスを参照してください。
 

[PR] Pythonで挫折しない学習方法を動画で公開中

実際に書いてみよう

サンプルコード

import re

# 例文。Python 3.7.3のリリースノートより一部抜粋。
sample_text = '''Python 3.7.3
Release Date: March 25, 2019
Python 3.7.3 is the third maintenance release of Python 3.7.
The Python 3.7 series is the newest major release of the Python language and contains many new features and optimizations.
Among the major new features in Python 3.7 are:
PEP 539, new C API for thread-local storage
PEP 545, Python documentation translations
'''

regex = re.compile('d+')

for line in sample_text.splitlines():
  match = regex.findall(line)
  print(match)

 

実行結果

['3', '7', '3']
['25', '2019']
['3', '7', '3', '3', '7']
['3', '7']
['3', '7']
['539']
['545']

 

解説

最初にreモジュールをインポートしました。次に、数字を含む適当な文字列を用意しました。

re.compileメソッドで正規表現をコンパイルしました。d+は1つ以上の連続する数字にマッチするパターンです。

forループで文字列1行ごとにループします。forループ内では文字列1行に正規表現を適用します。

マッチする文字列全てを抽出するため、findallメソッドを用いました。
 

監修してくれたメンター

橋本紘希

システムインテグレータ企業勤務のシステムエンジニア。

開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。

挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。

初心者・未経験でもできる。まずはテックアカデミーに相談しよう

プログラミングを独学していて、このように感じた経験はないでしょうか?

  • ・調べてもほしい情報が見つからない
  • ・独学のスキルが実際の業務で通用するのか不安
  • ・目標への学習プランがわからず、迷子になりそう

テックアカデミーでは、このような 学習に不安を抱えている方へ、現役エンジニア講師とマンツーマンで相談できる機会を無料で提供 しています。
30分間、オンラインでどんなことでも質問し放題です。

「受けてよかった」と感じていただけるよう 厳しい試験を通過した講師 があなたの相談に真摯に向き合います。

「ただ気になることを相談したい」
「漠然としているがプロの話を聞いてみたい」

こんな気持ちでも大丈夫です。

無理な勧誘は一切ありません ので、まずはお気軽にご参加ください。
※体験用のカリキュラムも無料で配布いたします。(1週間限定)

今なら参加者限定の割引特典付き! 無料相談を予約する