(23) GTX760からGTX780に変えてみる

投稿者: | 2014年9月11日

(22) cuda-convnet2はやってみれない (T_T) で残念な思いをしたのは20日ほど前のこと。
ここ最近で1万円近く値段が下がってきたGTX780を4万円少々で衝動買いした。

27cmもある長いボードは窮屈な筐体内で電気ストーブのように高熱を発しており…
しばらくはこまめに温度を確認しながら使うことになりそう。
20140911_01

1. 中身をのぞいてみる

deviceQueryの結果は以下の通り。
Compute capability 3.5 がうれしい!
GTX780のcore数は 2304個、GTX650 384個の6倍、GTX760 1152個の2倍になった!

Device 0: "GeForce GTX 780"
  CUDA Driver Version / Runtime Version          6.0 / 6.0
  CUDA Capability Major/Minor version number:    3.5
  Total amount of global memory:                 3071 MBytes (3220504576 bytes)
  (12) Multiprocessors, (192) CUDA Cores/MP:     2304 CUDA Cores
  GPU Clock rate:                                1058 MHz (1.06 GHz)
  Memory Clock rate:                             3104 Mhz
  Memory Bus Width:                              384-bit
  L2 Cache Size:                                 1572864 bytes

2. cuda-convnetで速度計測

(21) GTX650からGTX760に変えてみる のときと同じく、ちょっとリッチなMNIST学習用ネットワーク100epochsで計測した。

結果1: 最新環境(intel Xeon x5570 x 2, GTX780)

100epochsの処理時間は 100秒 、エラー率は 0.010だった。

START: 2014年  9月 11日 木曜日 20:57:46 JST
======================Test output======================
logprob:  0.034160, 0.010400
END:   2014年  9月 11日 木曜日 20:59:26 JST

結果2: 直前環境(intel Xeon x5570 x 2, GTX760)

100epochsの処理時間は 157秒 、エラー率は 0.010だった。

START: 2014年  8月 18日 月曜日 15:24:10 JST
======================Test output======================
logprob:  0.034883, 0.010300
END:   2014年  8月 18日 月曜日 15:26:47 JST

結果3: 旧マシン(intel core-i3 3220, GTX650)

100epochsの処理時間は 398秒 、エラー率は 0.011だった。

START: 2014年  8月 18日 月曜日 15:23:48 JST
======================Test output======================
logprob:  0.034047, 0.010900
END:   2014年  8月 18日 月曜日 15:30:26 JST

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*