Pythonで文字列から数字だけ抽出する方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonで文字列から数字だけ抽出する方法について現役エンジニアが解説しています。正規表現とは、ある特定のパターンを持つ文字列を指定する表記法で検索や置換、抽出などを行う際に使います。Pythonではreモジュールのメソッドを使います。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営する教育×テクノロジーのWebメディアです。初心者でもすぐ勉強できる記事が2,000以上あります。

Pythonで文字列から数字だけ抽出する方法について解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事をまずご覧ください。

 

なお本記事は、TechAcademyのPythonオンライン講座の内容をもとにしています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonで文字列から数字だけ抽出する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

正規表現とは

正規表現とは、ある特定のパターンを持つ文字列を指定する表記法の1つです。文字列の検索や置換、抽出などを行う際に用います。

プログラムで大量のテキストを一括処理する際に頻出の技法です。
 

reモジュールで文字列を検索する

Pythonで正規表現を使うにはreモジュールが便利です。

1つ目の使い方はあらかじめ正規表現をコンパイル(前処理)しておく方法です。正規表現を繰り返し使う場合には、効率が良いです。
 

regex = re.compile(pattern)
result = regex.search(string)

 

2つ目の使い方は直接re.searchメソッドを使う方法です。正規表現を1回だけ使う場合などは、こちらの方が簡易です。
 

result = re.search(pattern, string)

 
reモジュールの詳細な用法は公式リファレンスを参照してください。
 

[PR] Pythonで挫折しない学習方法を動画で公開中

実際に書いてみよう

サンプルコード

import re

# 例文。Python 3.7.3のリリースノートより一部抜粋。
sample_text = '''Python 3.7.3
Release Date: March 25, 2019
Python 3.7.3 is the third maintenance release of Python 3.7.
The Python 3.7 series is the newest major release of the Python language and contains many new features and optimizations.
Among the major new features in Python 3.7 are:
PEP 539, new C API for thread-local storage
PEP 545, Python documentation translations
'''

regex = re.compile('\d+')

for line in sample_text.splitlines():
  match = regex.findall(line)
  print(match)

 

実行結果

['3', '7', '3']
['25', '2019']
['3', '7', '3', '3', '7']
['3', '7']
['3', '7']
['539']
['545']

 

解説

最初にreモジュールをインポートしました。次に、数字を含む適当な文字列を用意しました。

re.compileメソッドで正規表現をコンパイルしました。\d+は1つ以上の連続する数字にマッチするパターンです。

forループで文字列1行ごとにループします。forループ内では文字列1行に正規表現を適用します。

マッチする文字列全てを抽出するため、findallメソッドを用いました。
 

監修してくれたメンター

橋本紘希

システムインテグレータ企業勤務のシステムエンジニア。

開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

オンラインのプログラミングスクールTechAcademyではPythonを使って機械学習の基礎を学ぶPythonオンライン講座を開催しています。

初心者向けの書籍を使って人工知能(AI)や機械学習について学ぶことができます。

現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、最短4週間で習得することが可能です。

また、現役エンジニアから学べる無料のプログラミング体験会も実施しているので、ぜひ参加してみてください。