Pythonで文字列から数字だけ抽出する方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonで文字列から数字だけ抽出する方法について現役エンジニアが解説しています。正規表現とは、ある特定のパターンを持つ文字列を指定する表記法で検索や置換、抽出などを行う際に使います。Pythonではreモジュールのメソッドを使います。

TechAcademyマガジンは受講者数No.1のオンラインプログラミングスクールTechAcademy [テックアカデミー]が運営。初心者向けに解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。

Pythonで文字列から数字だけ抽出する方法について解説します。

そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonで文字列から数字だけ抽出する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

正規表現とは

正規表現とは、ある特定のパターンを持つ文字列を指定する表記法の1つです。文字列の検索や置換、抽出などを行う際に用います。

プログラムで大量のテキストを一括処理する際に頻出の技法です。
 

reモジュールで文字列を検索する

Pythonで正規表現を使うにはreモジュールが便利です。

1つ目の使い方はあらかじめ正規表現をコンパイル(前処理)しておく方法です。正規表現を繰り返し使う場合には、効率が良いです。
 

regex = re.compile(pattern)
result = regex.search(string)

 

2つ目の使い方は直接re.searchメソッドを使う方法です。正規表現を1回だけ使う場合などは、こちらの方が簡易です。
 

result = re.search(pattern, string)

 
reモジュールの詳細な用法は公式リファレンスを参照してください。
 

[PR] Pythonで挫折しない学習方法を動画で公開中

実際に書いてみよう

サンプルコード

import re

# 例文。Python 3.7.3のリリースノートより一部抜粋。
sample_text = '''Python 3.7.3
Release Date: March 25, 2019
Python 3.7.3 is the third maintenance release of Python 3.7.
The Python 3.7 series is the newest major release of the Python language and contains many new features and optimizations.
Among the major new features in Python 3.7 are:
PEP 539, new C API for thread-local storage
PEP 545, Python documentation translations
'''

regex = re.compile('\d+')

for line in sample_text.splitlines():
  match = regex.findall(line)
  print(match)

 

実行結果

['3', '7', '3']
['25', '2019']
['3', '7', '3', '3', '7']
['3', '7']
['3', '7']
['539']
['545']

 

解説

最初にreモジュールをインポートしました。次に、数字を含む適当な文字列を用意しました。

re.compileメソッドで正規表現をコンパイルしました。\d+は1つ以上の連続する数字にマッチするパターンです。

forループで文字列1行ごとにループします。forループ内では文字列1行に正規表現を適用します。

マッチする文字列全てを抽出するため、findallメソッドを用いました。
 

監修してくれたメンター

橋本紘希

システムインテグレータ企業勤務のシステムエンジニア。

開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも最短4週間でPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。

挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。