PythonのKerasでMNISTデータを処理する方法を現役エンジニアが解説【初心者向け】
初心者向けにPythonのKerasでMNISTデータを処理する方法について現役エンジニアが解説しています。MNIST(エムニスト)とは、画像認識やディープラーニングの分野で用いられる手書き数字の画像データセットです。Keras(ケラス)とはディープラーニングを実装するためのライブラリです。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
PythonのKerasでMNISTデータを処理する方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。
Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まるでしょう。
なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
PythonのKerasでMNISTデータを処理する方法について詳しく説明していくね!
お願いします!
MNISTとは
MNIST(エムニスト)とは、「画像認識やディープラーニングの分野で使用される最も有名な手書き数字の画像データセット」です。
汎用性が高く、初心者から研究者まで幅広く用いられているのが特徴です。
また、MNISTは画像1枚につき0から9までのいずれかの数字が1つ書かれています。
1枚の画像は26×26ピクセルのモノクロ画像であり、画像は訓練データ60000枚、テストデータ10000枚から構成されています。
訓練データとテストデータは、例えば手書きで7と書かれているデータに対して、7という正解ラベルが付与されている状態です。
訓練データを使って学習を実施し、その学習結果をテストデータで評価するという関係性があります。
Kerasとは
Keras(ケラス)とは、「ディープラーニングのプログラムを簡単に実装するためのライブラリ」です。
Kerasは内部で、TensorFlow(テンソルフロー)といったディープラーニングのためのライブラリを使用しています。
TensorFlowは、上級者向けのライブラリであるため、「学習コストが高い」「実装が困難」といった課題がありました。
そのため、誰でも比較的簡単にディープラーニングを実装できるようにしたものがKerasです。
Kerasを使えば、その内容まで理解せずともディープラーニングを実装することが可能です。
しかし、応用が効きにくいといったデメリットがあることは覚えておきましょう。
Kerasの使い方
AnacondaからKerasを用いる方法を解説していきます。
AnacondaにKerasをインストール手順は以下の通りです。
- メニュー画面のEnvironmentsから、Not Installedを選択。
- 検索ボックスにKerasと入力。
- Kerasを選択し、右下のApplyボタンを押す。
同様の操作でTensorFlowもインストールしておきましょう。
実際に書いてみよう
ここでは、Kerasを使ってMNIST読み込み、簡単なデータの前処理を実施してみます。
今回は以下のようなコードを使用していきましょう。
import numpy as np from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Activation from keras.utils import np_utils (X_train, y_train), (X_test, y_test) = mnist.load_data() #それぞれの形式を確認 print(X_train.shape, y_train.shape) print(X_test.shape, y_test.shape) X_train = X_train.reshape(60000, 784) X_test = X_test.reshape(10000, 784) #uint8からfloat32に変換 X_train = X_train.astype("float32") X_test = X_test.astype("float32") #0~1の範囲に正規化 X_train /= 255 X_test /= 255 #正解ラベルをone-hot表現に変換 Y_train = np_utils.to_categorical(y_train, 10) Y_test = np_utils.to_categorical(y_test, 10)
mnist.load_data()はMNISTを読み込むために使用します。
そして、shapeではそれぞれのデータの形式を確認し、学習のためにreshapeで形式を整形しました。
正規化のためにデータ型をfloat32に変換し、実際に正規化しています。
正解ラベルはone-hot表現(例えば正解が7の場合、7そのものではなく[0,0,0,0,0,0,0,1,0,0]のように1が入っている場所で7という数値を表す方法)で表しています。
まとめ
この記事では、KerasでMNISTを扱う方法について解説しました。。
Kerasを使いこなせるようになると、ディープラーニングの開発効率が上がるため、学習していきましょう。
執筆してくれたメンター
柴山真沙希(しばやままさき)
大手IT企業などでエンジニアとして2年ほど勤務した後、個人事業主としてプログラミングスクール「エンペサール」を経営。 子供から大人まで幅広い層を対象にプログラミングを教えている。 得意言語はPython, HTML, CSSで、機械学習やデータ分析、スクレイピングなどが得意。 サッカー観戦や読書が趣味である。 |
PythonのKerasでMNISTデータを処理する方法がよく分かったので良かったです!
ゆかりちゃん、今後も分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でも、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。
また、現役エンジニアから学べる無料体験も実施しているので、参加してみてください。