2,189 views
この記事は最終更新から 961日 が経過しています。
(22) cuda-convnet2はやってみれない (T_T) で残念な思いをしたのは20日ほど前のこと。
ここ最近で1万円近く値段が下がってきたGTX780を4万円少々で衝動買いした。
27cmもある長いボードは窮屈な筐体内で電気ストーブのように高熱を発しており…
しばらくはこまめに温度を確認しながら使うことになりそう。
1. 中身をのぞいてみる
deviceQueryの結果は以下の通り。
Compute capability 3.5 がうれしい!
GTX780のcore数は 2304個、GTX650 384個の6倍、GTX760 1152個の2倍になった!
Device 0: "GeForce GTX 780"
CUDA Driver Version / Runtime Version 6.0 / 6.0
CUDA Capability Major/Minor version number: 3.5
Total amount of global memory: 3071 MBytes (3220504576 bytes)
(12) Multiprocessors, (192) CUDA Cores/MP: 2304 CUDA Cores
GPU Clock rate: 1058 MHz (1.06 GHz)
Memory Clock rate: 3104 Mhz
Memory Bus Width: 384-bit
L2 Cache Size: 1572864 bytes
2. cuda-convnetで速度計測
(21) GTX650からGTX760に変えてみる のときと同じく、ちょっとリッチなMNIST学習用ネットワーク100epochsで計測した。
結果1: 最新環境(intel Xeon x5570 x 2, GTX780)
100epochsの処理時間は 100秒 、エラー率は 0.010だった。
START: 2014年 9月 11日 木曜日 20:57:46 JST ======================Test output====================== logprob: 0.034160, 0.010400 END: 2014年 9月 11日 木曜日 20:59:26 JST
結果2: 直前環境(intel Xeon x5570 x 2, GTX760)
100epochsの処理時間は 157秒 、エラー率は 0.010だった。
START: 2014年 8月 18日 月曜日 15:24:10 JST ======================Test output====================== logprob: 0.034883, 0.010300 END: 2014年 8月 18日 月曜日 15:26:47 JST
結果3: 旧マシン(intel core-i3 3220, GTX650)
100epochsの処理時間は 398秒 、エラー率は 0.011だった。
START: 2014年 8月 18日 月曜日 15:23:48 JST ======================Test output====================== logprob: 0.034047, 0.010900 END: 2014年 8月 18日 月曜日 15:30:26 JST