PythonでDTW(Dynamic Time Warping)を実装する方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonでDTW(Dynamic Time Warping)を実装する方法について現役エンジニアが解説しています。DTWとは時系列データ同士の類似度を求める際に使用される手法で、音声認識や文字認識の分野で使われています。fastdtwライブラリを使い実装しmatplotlibでグラフにして表示させます。

TechAcademyマガジンは受講者数No.1のオンラインプログラミングスクールTechAcademy [テックアカデミー]が運営。初心者向けに解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。

PythonでDTW(Dynamic Time Warping)を実装する方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

 

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

PythonでDTW(Dynamic Time Warping)を実装する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

DTW(Dynamic Time Warping、動的時間伸縮法)とは

DTWとは、時系列データ同士の類似度を求める際に使用される手法です。

初めて編み出された際は1960年代で、音声認識や文字認識の分野で使われていたようです。時系列データ解析の中でとてもシンプルな手法で学習コストは低いですが、ノイズに弱いなどのデメリットもあります。

DTW(Dynamic Time Warping、動的時間伸縮法)を実装する方法

PythonでDTWを実装する際方法はいくつかあります。

  • numpyを使ってアルゴリズムを実装する
  • fastdtwライブラリを使う

データ分析をする時にアルゴリズムの調整をできるように、前者の方法で関数を実装することがありますが、今回は実際にDTWを体験するために後者のdtwライブラリを使っていきます。

fastdtwライブラリをインストール

pipでインストールができますので、以下の1行でインストールをします。なお、今回はpython3.6で試しています。

pip install fastdtw

また、計算結果を出力させるためにmatplotlibも合わせてインストールしましょう。

pip install matplotlib

 

[PR] Pythonで挫折しない学習方法を動画で公開中

実際に書いてみよう

それでは、実際にDTWの結果を出力するコードを書いていきます。

以下のコードを適当な場所に保存しましょう。

import numpy as np
from scipy.spatial.distance import euclidean
from fastdtw import fastdtw
from matplotlib import pyplot as plt
# 異なる2種類のデータを定義
x = np.array([2, 0, 1, 1, 2, 4, 2, 1, 2, 0]).reshape(-1, 1)
y = np.array([1, 1, 2, 4, 2, 1, 2, 0]).reshape(-1, 1)
# DTWを計算
distance, path = fastdtw(x, y, dist=euclidean)
print("DTW距離:", distance)
plt.plot(x, label='x')
plt.plot(y, label='y')
# 各点がどのように対応しているかを図示する
for x_, y_ in path:
  plt.plot([x_, y_], [x[x_], y[y_]], color='gray', linestyle='dotted', linewidth=1)
plt.legend()
plt.title('Our two temporal sequences')
plt.show()

実行すると以下のようなグラフが出力されます。

PythonでDTW(Dynamic Time Warping、動的時間伸縮法)を実装するためにfastdtwを使い結果をmatplotlibで出力した画像。

まとめ

今回はDTWの実装を紹介しました。

現在でもこの方法で音声認識を行うなど、時系列データの解析では活躍されています。ただ、ノイズに対しては弱いので、前処理はしっかりやる必要があります。

監修してくれたメンター

メンター三浦

モバイルゲームを運用している会社のエンジニアをしています。趣味でWEB開発やクラウドコンピューティングもやっており、ソフトもハードもなんでもやります。

TechAcademyジュニアではPythonロボティクスコースを担当しています。好きな言語はPython, Node.js。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。