2,861 views
この記事は最終更新から 1791日 が経過しています。
ヤフオクを眺めていたらよさげなワークステーションが安価で出品されていたのでこれを購入した。
スペックは以下の通り。これで6万円弱は安い!
・CPU: Xeon X5570 x 2個 (全16core)
・memory: 24GB
・GPU: Quadro 4000
このワークステーション、電源にも余裕があるので GPU2枚組を目論んで 2万円弱のGTX760も落札した。
今使っているGTX650のCudaCore数が 384個、これに対してGTX760は 1152個、なんと3倍!
比較その1: cuda-convnet
まずはcuda-convnetで速度性能を比較してみた。
対象は (15) cuda-convnetでMNIST自動認識(その2) で動かしたちょっとリッチなネットワークを100epochsとした。
結果1: 旧マシン (intel core-i3 3220, GTX650)
START: 2014年 8月 18日 月曜日 15:23:48 JST ======================Test output====================== logprob: 0.034047, 0.010900 END: 2014年 8月 18日 月曜日 15:30:26 JST
100epochsの処理時間は 398秒 、エラー率は 0.011だった。
結果2: 新マシン (intel Xeon x5570 x 2, GTX760)
START: 2014年 8月 18日 月曜日 15:24:10 JST ======================Test output====================== logprob: 0.034883, 0.010300 END: 2014年 8月 18日 月曜日 15:26:47 JST
100epochsの処理時間は 157秒 、エラー率は 0.010だった。
両者の処理時間の差は 398 : 157 だから 2.5 : 1 だった。
約8万円の投資で 2.5倍に高速化した。 微妙…
比較その2: Caffe
次に caffeで速度性能を比較してみた。
対象は (20) CaffeでMNIST自動認識(その1) で動かしたCaffe付属サンプル 10,000batchesとした。
結果1: 旧マシン (intel core-i3 3220, GTX650)
I0813 20:23:56.937985 4618 solver.cpp:165] Solving LeNet I0813 20:23:56.937995 4618 solver.cpp:232] Iteration 0, Testing net (#0) I0813 20:23:58.769482 4618 solver.cpp:270] Test score #0: 0.0427 I0813 20:23:58.769534 4618 solver.cpp:270] Test score #1: 2.30319 ======================Test output====================== I0813 20:30:07.157430 4618 solver.cpp:270] Test score #0: 0.9911 I0813 20:30:07.157462 4618 solver.cpp:270] Test score #1: 0.0283371 I0813 20:30:07.157470 4618 solver.cpp:218] Optimization Done. I0813 20:30:07.157475 4618 caffe.cpp:102] Optimization Done.
10,000batchesの処理時間は 371秒 、正解率は 99.1%だった。
結果2: 新マシン (intel Xeon x5570 x 2, GTX760)
I0820 07:33:07.595406 9520 solver.cpp:165] Solving LeNet I0820 07:33:07.595415 9520 solver.cpp:232] Iteration 0, Testing net (#0) I0820 07:33:08.551427 9520 solver.cpp:270] Test score #0: 0.0566 I0820 07:33:08.551476 9520 solver.cpp:270] Test score #1: 2.30261 ======================Test output====================== I0820 07:36:17.788245 9520 solver.cpp:270] Test score #0: 0.9914 I0820 07:36:17.788260 9520 solver.cpp:270] Test score #1: 0.0278619 I0820 07:36:17.788269 9520 solver.cpp:218] Optimization Done. I0820 07:36:17.788275 9520 caffe.cpp:102] Optimization Done.
10,000batchesの処理時間は 189秒 、エラー率は 99.1%だった。
両者の処理時間の差は 371 : 189 だから 1.96 : 1 だった。
約8万円の投資で 1.96倍に高速化した。 微妙…
PS.
GPU2枚組を目論んだが、GTX760が補助電源を2口も使ってしまい、電源コネクタが不足…
残念ながら古いQuadroは外すことになった…
今度差し替えてQuadroでも計測してみよう。