20,760 views
この記事は最終更新から 1795日 が経過しています。
1. MNISTファイルの入手
MNIST手書き文字画像データはこちらのサイトから入手できます。
http://yann.lecun.com/exdb/mnist/
提供されるデータは以下の4種類
(1)学習用画像
(2)学習用画像のラベル(=識別番号)
(3)テスト用画像
(4)テスト用画像のラベル(=識別番号)
2. ファイルの形式
ファイルの形式は上記ページの下の方の FILE FORMATS FOR THE MNIST DATABASE に書かれている。
仕様はとってもシンプルだ。
例えば、学習用画像データは以下のような決まりでファイルに格納されている。
なお、ダウンロードしたファイルは gzip型式で圧縮されており、gunzipコマンドで解凍できる。
[user@dog-server]$ ls -l
合計 11336
-rw-rw-r--. 1 user user 1648877 10月 5 01:51 2013 t10k-images-idx3-ubyte.gz
-rw-rw-r--. 1 user user 4542 10月 5 01:51 2013 t10k-labels-idx1-ubyte.gz
-rw-rw-r--. 1 user user 9912422 10月 5 01:51 2013 train-images-idx3-ubyte.gz
-rw-rw-r--. 1 user user 28881 10月 5 01:51 2013 train-labels-idx1-ubyte.gz
[user@dog-server]$ gunzip *.gz
[user@dog-server]$ ls -l
合計 53672
-rw-rw-r--. 1 user user 7840016 10月 5 01:51 2013 t10k-images-idx3-ubyte
-rw-rw-r--. 1 user user 10008 10月 5 01:51 2013 t10k-labels-idx1-ubyte
-rw-rw-r--. 1 user user 47040016 10月 5 01:51 2013 train-images-idx3-ubyte
-rw-rw-r--. 1 user user 60008 10月 5 01:51 2013 train-labels-idx1-ubyte
[user@dog-server]$
次回「(2) MNIST学習画像を見てみる」では、ダウンロードしたデータの中身を実際に見てみる。