CUDA C と DirectCompute, CUDA Toolkit 3.1 について

最近, 趣味で CUDA C と DirectCompute の勉強をしています.

CUDA C は, NVidiaGPU の CUDA アーキテクチャを意識したものになっていて, 設定するパラメータが多く, かなり細かいチューニングが効きそうです.

一方で, DirectCompute はDirect3D のリソースが手軽に使えるのが良いところなのですが, 演算時に指定するパラメータが今のところスレッド数ぐらいしか見当たらないので, 細かい最適化ができるのかどうかが疑問です.

あと, NVidia が配布している CUDA Toolkit 3.1 の CUDA のサンプルプログラムは GeForce GTX 285 では動作しますが, NVS 3100M(Thinkpad T510のGPU) ではランタイムエラーが発生して動作しないです. 一方で, NVidia が配布しているDirectCompute のプログラムはどちらの GPU でも動作します.