Pythonで正規表現を利用して電話番号を取得する方法を現役エンジニアが解説【初心者向け】

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営。初心者向けに解説した記事が4,000以上あります。現役エンジニアの方はこちらをご覧ください。

Pythonによるリストからインデックスを取得する方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonで画像ファイルをPDF化する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

目次

 

正規表現とは

正規表現の定義は、「いくつかの文字列を一つの形式で表現するための表現方法」です。正規表現を利用すれば、たくさんの文章の中から容易に見つけたい文字列を検索することが可能です。

 

[PR] Pythonで挫折しない学習方法を動画で公開中

正規表現のメタ文字について

「いくつかの文字列を一つの形式で表現するための表現方法」です。その「一つの形式で表現するため」に、いくつかのある文字に対して特別な意味を与えています。その特別な文字のことをメタ文字と呼びます。

以下に述べる文字がその役割を担っています。

.   ^   $   [   ]   *   +   ?   |   (   )

.  -> 任意の一文字です。
^  -> 行の先頭を意味します。
$  -> 行の最後尾を意味します。
[] -> []の中に範囲などを指定します。 
*  -> 任意の文字数
+  -> 直前の文字の1回以上の繰り返し
?  -> 直前の文字は省略可能
|  ->  論理和です。
() ->  ( )内を1文字扱い

電話番号を取得するための正規表現

電話番号を検索でヒットさせるには正規表現をどのように記述すればよいでしょうか?例として 以下の番号を検索でヒットさせてみましょう。

12-3456-7899
33-5678-7777
44-1283-9812

電話番号をテキストファイルから検索してヒットするような正規表現を考えてみましょう。

まず、上の電話番号をみて思うのは、数字が2つ続く、その次にハイフン(-)、そしてその次に数字が4つならび、またハイフン(-) そしてその後に数字が4つ続きます。

 

実際に書いてみよう

正規表現で数字1文字を表現するには[0-9]を使用します。上記の電話番号を正規表現で表すと

[0-9][0-9]-[0-9][0-9][0-9][0-9]-[0-9][0-9] [0-9][0-9]

となりますね。

 

まとめ

テキスト処理において正規表現はUNIXと共に存在してきた伝統的な存在です。計算機科学とも相性の良い歴史を感じつつ今なお強力なツールです。是非習得しましょう

 

監修してくれたメンター

坂下雄一(さかしたゆういち)

フリーランスのエンジニア、飲食業経営
エンジニア経歴:EDAの自動化環境、テスト環境構築。組み込みマイコンプログラミング(車載、インフラ系):医療用DB、登録自動化、患者管理システム等

飲食店経営:ラオスはルアンパバーン、フィリピンのセブで寿司屋、ラーメン屋を経営。
現在バンコク在住。コワーキングスペースのハシゴが職場環境。ムエタイとタイ語とゴルフを絶賛習得中。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも最短4週間で、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。