PythonのKerasでMNISTデータを処理する方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonのKerasでMNISTデータを処理する方法について現役エンジニアが解説しています。MNIST(エムニスト)とは、画像認識やディープラーニングの分野で用いられる手書き数字の画像データセットです。Keras(ケラス)とはディープラーニングを実装するためのライブラリです。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営する教育×テクノロジーのWebメディアです。初心者でもすぐ勉強できる記事が2,000以上あります。

PythonのKerasでMNISTデータを処理する方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

 

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まるでしょう。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

PythonのKerasでMNISTデータを処理する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

MNISTとは

MNIST(エムニスト)とは、「画像認識やディープラーニングの分野で使用される最も有名な手書き数字の画像データセット」です。

汎用性が高く、初心者から研究者まで幅広く用いられているのが特徴です。

また、MNISTは画像1枚につき0から9までのいずれかの数字が1つ書かれています。

1枚の画像は26×26ピクセルのモノクロ画像であり、画像は訓練データ60000枚、テストデータ10000枚から構成されています。

訓練データとテストデータは、例えば手書きで7と書かれているデータに対して、7という正解ラベルが付与されている状態です。

訓練データを使って学習を実施し、その学習結果をテストデータで評価するという関係性があります。

 

Kerasとは

Keras(ケラス)とは、「ディープラーニングのプログラムを簡単に実装するためのライブラリ」です。

Kerasは内部で、TensorFlow(テンソルフロー)といったディープラーニングのためのライブラリを使用しています。

TensorFlowは、上級者向けのライブラリであるため、「学習コストが高い」「実装が困難」といった課題がありました。

そのため、誰でも比較的簡単にディープラーニングを実装できるようにしたものがKerasです。

Kerasを使えば、その内容まで理解せずともディープラーニングを実装することが可能です。

しかし、応用が効きにくいといったデメリットがあることは覚えておきましょう。

 

[PR] Pythonで挫折しない学習方法を動画で公開中

Kerasの使い方

AnacondaからKerasを用いる方法を解説していきます。

AnacondaにKerasをインストール手順は以下の通りです。

  1. メニュー画面のEnvironmentsから、Not Installedを選択。
  2. 検索ボックスにKerasと入力。
  3. Kerasを選択し、右下のApplyボタンを押す。

同様の操作でTensorFlowもインストールしておきましょう。

KerasでMNIST データを処理するために、AnacondaからKerasをインストールする方法。

実際に書いてみよう

ここでは、Kerasを使ってMNIST読み込み、簡単なデータの前処理を実施してみます。

今回は以下のようなコードを使用していきましょう。

import numpy as np
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.utils import np_utils
(X_train, y_train), (X_test, y_test) = mnist.load_data()
#それぞれの形式を確認
print(X_train.shape, y_train.shape)
print(X_test.shape, y_test.shape)
X_train = X_train.reshape(60000, 784)
X_test = X_test.reshape(10000, 784)
#uint8からfloat32に変換
X_train = X_train.astype("float32")
X_test = X_test.astype("float32")
#0~1の範囲に正規化
X_train /= 255
X_test /= 255
#正解ラベルをone-hot表現に変換
Y_train = np_utils.to_categorical(y_train, 10)
Y_test = np_utils.to_categorical(y_test, 10)

 

mnist.load_data()はMNISTを読み込むために使用します。

そして、shapeではそれぞれのデータの形式を確認し、学習のためにreshapeで形式を整形しました。

正規化のためにデータ型をfloat32に変換し、実際に正規化しています。

正解ラベルはone-hot表現(例えば正解が7の場合、7そのものではなく[0,0,0,0,0,0,0,1,0,0]のように1が入っている場所で7という数値を表す方法)で表しています。

 

まとめ

この記事では、KerasでMNISTを扱う方法について解説しました。。

Kerasを使いこなせるようになると、ディープラーニングの開発効率が上がるため、学習していきましょう。

 

執筆してくれたメンター

柴山真沙希(しばやままさき)

大手IT企業などでエンジニアとして2年ほど勤務した後、個人事業主としてプログラミングスクール「エンペサール」を経営。

子供から大人まで幅広い層を対象にプログラミングを教えている。

得意言語はPython, HTML, CSSで、機械学習やデータ分析、スクレイピングなどが得意。

サッカー観戦や読書が趣味である。

 

大石ゆかり

PythonのKerasでMNISTデータを処理する方法がよく分かったので良かったです!

田島悠介

ゆかりちゃん、今後も分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも最短4週間で、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、参加してみてください。