21,800 views
この記事は最終更新から 372日 が経過しています。
1. MNISTファイルの入手
MNIST手書き文字画像データはこちらのサイトから入手できます。
http://yann.lecun.com/exdb/mnist/

※追記:2025.04.20
上記サイトが消えている。以下のページから同じデータセットファイルをダウンロードできる。
https://systemds.apache.org/datasets/mnist

提供されるデータは以下の4種類
(1)学習用画像
(2)学習用画像のラベル(=識別番号)
(3)テスト用画像
(4)テスト用画像のラベル(=識別番号)

2. ファイルの形式
ファイルの形式は上記ページの下の方の FILE FORMATS FOR THE MNIST DATABASE に書かれている。
仕様はとってもシンプルだ。
例えば、学習用画像データは以下のような決まりでファイルに格納されている。

なお、ダウンロードしたファイルは gzip型式で圧縮されており、gunzipコマンドで解凍できる。
$ ls -l 合計 11336 -rw-rw-r--. 1 user user 1648877 10月 5 01:51 2013 t10k-images-idx3-ubyte.gz -rw-rw-r--. 1 user user 4542 10月 5 01:51 2013 t10k-labels-idx1-ubyte.gz -rw-rw-r--. 1 user user 9912422 10月 5 01:51 2013 train-images-idx3-ubyte.gz -rw-rw-r--. 1 user user 28881 10月 5 01:51 2013 train-labels-idx1-ubyte.gz $ gunzip *.gz $ ls -l 合計 53672 -rw-rw-r--. 1 user user 7840016 10月 5 01:51 2013 t10k-images-idx3-ubyte -rw-rw-r--. 1 user user 10008 10月 5 01:51 2013 t10k-labels-idx1-ubyte -rw-rw-r--. 1 user user 47040016 10月 5 01:51 2013 train-images-idx3-ubyte -rw-rw-r--. 1 user user 60008 10月 5 01:51 2013 train-labels-idx1-ubyte
次回「(2) MNIST学習画像を見てみる」では、ダウンロードしたデータの中身を実際に見てみる。
アクセス数(直近7日): ※試験運用中、BOT除外簡易実装済2026-06-19: 0回 2026-06-18: 0回 2026-06-17: 0回 2026-06-16: 2回 2026-06-15: 1回 2026-06-14: 1回 2026-06-13: 0回