Pythonで文字列から数字だけ抽出する方法を現役エンジニアが解説【初心者向け】
初心者向けにPythonで文字列から数字だけ抽出する方法について現役エンジニアが解説しています。正規表現とは、ある特定のパターンを持つ文字列を指定する表記法で検索や置換、抽出などを行う際に使います。Pythonではreモジュールのメソッドを使います。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
Pythonで文字列から数字だけ抽出する方法について解説します。
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
Pythonで文字列から数字だけ抽出する方法について詳しく説明していくね!
お願いします!
正規表現とは
正規表現とは、ある特定のパターンを持つ文字列を指定する表記法の1つです。文字列の検索や置換、抽出などを行う際に用います。
プログラムで大量のテキストを一括処理する際に頻出の技法です。
reモジュールで文字列を検索する
Pythonで正規表現を使うにはreモジュールが便利です。
1つ目の使い方はあらかじめ正規表現をコンパイル(前処理)しておく方法です。正規表現を繰り返し使う場合には、効率が良いです。
regex = re.compile(pattern) result = regex.search(string)
2つ目の使い方は直接re.searchメソッドを使う方法です。正規表現を1回だけ使う場合などは、こちらの方が簡易です。
result = re.search(pattern, string)
reモジュールの詳細な用法は公式リファレンスを参照してください。
実際に書いてみよう
サンプルコード
import re # 例文。Python 3.7.3のリリースノートより一部抜粋。 sample_text = '''Python 3.7.3 Release Date: March 25, 2019 Python 3.7.3 is the third maintenance release of Python 3.7. The Python 3.7 series is the newest major release of the Python language and contains many new features and optimizations. Among the major new features in Python 3.7 are: PEP 539, new C API for thread-local storage PEP 545, Python documentation translations ''' regex = re.compile('d+') for line in sample_text.splitlines(): match = regex.findall(line) print(match)
実行結果
['3', '7', '3'] ['25', '2019'] ['3', '7', '3', '3', '7'] ['3', '7'] ['3', '7'] ['539'] ['545']
解説
最初にreモジュールをインポートしました。次に、数字を含む適当な文字列を用意しました。
re.compileメソッドで正規表現をコンパイルしました。d+は1つ以上の連続する数字にマッチするパターンです。
forループで文字列1行ごとにループします。forループ内では文字列1行に正規表現を適用します。
マッチする文字列全てを抽出するため、findallメソッドを用いました。
監修してくれたメンター
橋本紘希
システムインテグレータ企業勤務のシステムエンジニア。 開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。
プログラミングを独学で学習していて、このように感じた経験はないでしょうか?
- ・調べてもほしい情報が見つからない
- ・独学のスキルが実際の業務で通用するのか不安
- ・目標への学習プランがわからず、迷子になりそう
テックアカデミーでは、このような
学習に不安を抱えている方へ、マンツーマンで相談できる機会を無料で提供
しています。
30分間、オンラインでどんなことでも質問し放題です。
「受けてよかった」と感じていただけるよう
カウンセラーやエンジニア・デザイナー
があなたの相談に真摯に向き合います。
「自分に合っているか診断してほしい」
「漠然としているが話を聞いてみたい」
こんなささいな悩みでも大丈夫です。
無理な勧誘は一切ありません
ので、まずはお気軽にご参加ください。
※体験用のカリキュラムも無料で配布いたします。(1週間限定)