(1) MNIST画像データをダウンロード

投稿者: | 2013年10月5日

20,760 views

この記事は最終更新から 1795日 が経過しています。

1. MNISTファイルの入手

MNIST手書き文字画像データはこちらのサイトから入手できます。
http://yann.lecun.com/exdb/mnist/
https://www.dogrow.net/nnet/wp-content/uploads/2013/10/20131005_01.png

提供されるデータは以下の4種類
(1)学習用画像
(2)学習用画像のラベル(=識別番号)
(3)テスト用画像
(4)テスト用画像のラベル(=識別番号)
https://www.dogrow.net/nnet/wp-content/uploads/2013/10/20131005_02.png

2. ファイルの形式

ファイルの形式は上記ページの下の方の FILE FORMATS FOR THE MNIST DATABASE に書かれている。

仕様はとってもシンプルだ。
例えば、学習用画像データは以下のような決まりでファイルに格納されている。
https://www.dogrow.net/nnet/wp-content/uploads/2013/10/20131005_03.png

なお、ダウンロードしたファイルは gzip型式で圧縮されており、gunzipコマンドで解凍できる。

[user@dog-server]$ ls -l
合計 11336
-rw-rw-r--. 1 user user 1648877 10月  5 01:51 2013 t10k-images-idx3-ubyte.gz
-rw-rw-r--. 1 user user    4542 10月  5 01:51 2013 t10k-labels-idx1-ubyte.gz
-rw-rw-r--. 1 user user 9912422 10月  5 01:51 2013 train-images-idx3-ubyte.gz
-rw-rw-r--. 1 user user   28881 10月  5 01:51 2013 train-labels-idx1-ubyte.gz
[user@dog-server]$ gunzip *.gz
[user@dog-server]$ ls -l
合計 53672
-rw-rw-r--. 1 user user  7840016 10月  5 01:51 2013 t10k-images-idx3-ubyte
-rw-rw-r--. 1 user user    10008 10月  5 01:51 2013 t10k-labels-idx1-ubyte
-rw-rw-r--. 1 user user 47040016 10月  5 01:51 2013 train-images-idx3-ubyte
-rw-rw-r--. 1 user user    60008 10月  5 01:51 2013 train-labels-idx1-ubyte
[user@dog-server]$

次回「(2) MNIST学習画像を見てみる」では、ダウンロードしたデータの中身を実際に見てみる。


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です