Pythonのreモジュールのsub関数について現役エンジニアが解説【初心者向け】

初心者向けにPythonのreモジュールのsub関数について現役エンジニアが解説しています。reモジュールとは、正規表現を扱うためにPythonに用意されている標準モジュールです。sub()関数は文字列を置換するための関数です。引数には置き換えたい文字列と検索対象の文字列を指定します。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営。初心者向けに解説した記事が4,000以上あります。現役エンジニアの方はこちらをご覧ください。

Pythonのreモジュールのsub関数について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonのreモジュールのsub関数について詳しく説明していくね!

大石ゆかり

お願いします!

 

目次

  1. reモジュールとは
  2. sub関数の使い方
  3. 実際に書いてみよう
  4. まとめ

 

reモジュールとは

reモジュールとは、「正規表現(regular expression)を扱うためにPythonに用意されている標準モジュール」です。

正規表現を使うと、任意のパターンの文字列を扱うことができて非常に便利です。正規表現はエンジニアにとって必須の知識となります。

[PR] Pythonで挫折しない学習方法を動画で公開中

sub関数の使い方

sub()関数は文字列を置換するための関数です。

第一引数には「この文字列に置き換えたい」という文字列を、第二引数には検索対象の文字列を渡します。戻り値は置換後の文字列全体です。

実際に書いてみよう

先ほどの説明だけだとまだわかりにくいので、実際にsub()関数を使ってみましょう。まずはコードの概要を簡単にご説明します。

  1. reモジュールをインポート
  2. 置換したいテキストを準備
  3. compile()により正規表現オブジェクトを作成
  4. テキストからパターンを探し出して置換

この例ではテキストの中から” Mr. 〇〇”という文字列パターンを探して、” Ms. Green”に置き換える処理をしています。

サンプルコード

import re

text = "Nice to meet you. Mr. Mike."

regex = re.compile(r"Mr. \w+")

new_text = regex.sub("Ms. Green", text)

print(new_text)

出力結果

Nice to meet you. Ms. Green.

 

挨拶をする相手の名前を変えることができましたね。ここで、以下の部分が少し難しいと思うので詳しく説明します。

regex = re.compile(r"Mr. \w+")

このコードのcompile()の引数に使われている\wは任意の1文字(スペースやタブなどは含まない)を表しています。また、その後の+は1回以上の繰り返しを意味します。なので、\w+と記述することにより、1文字以上の繰り返しを意味します。

つまり、”Mr. 〇〇”という文字列パターンを探しているわけですね。

ちなみに引数の先頭に付いているrはrow文字列を表します。row文字列とは、「エスケープされない文字列」のことです。

正規表現では頻繁に\を用いるので、row文字列にしてエスケープを防ぐのが一般的です。仮にrow文字列にしなかった場合、\\で\マークを記述しなければならなくなるので、\\w+と書かなくてはなりません。見やすさのためにもrow文字列を使うことをオススメします。

※macOSでは\ではなく\(バックスラッシュ)なので注意してください。

まとめ

この記事ではPythonのreモジュールのsub関数の使い方についてご紹介しました。

冒頭でも述べましたが、正規表現はエンジニアにとって必須の知識です。使いこなせるのと使いこなせないのとでは作業効率が全然違いますので、絶対に使いこなせるようになりましょう。

監修してくれたメンター

柴山真沙希(しばやままさき)

大手IT企業などでエンジニアとして2年ほど勤務した後、個人事業主としてプログラミングスクール「エンペサール」を経営。子供から大人まで幅広い層を対象にプログラミングを教えている。

得意言語はPython, HTML, CSSで、機械学習やデータ分析、スクレイピングなどが得意。サッカー観戦や読書が趣味である。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも最短4週間で、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。