①CUDAコア②Tensorコア③RTコア
→処理性能をつかさどる部品です。それぞれ担当する分野が異なります
④メモリ容量⑤インターフェース(バス幅)⑥バンド幅
→処理速度、作業スペース、作業量に関係する部分です。
【①CUDA(クーダ)コア数は「映像に関する並列計算の処理能力」のこと 】
本来、GPUは3D映像や動画の再生など、映像関連の複雑な処理を高速化するために、並列で大量のデータを処理する仕組みを搭載しています。この並列処理を映像関連以外の用途で応用することを「GPGPU(General-Purpose computing on Graphics Processing Units)」または「GPUコンピューティング」といいます。
この「GPGPU」や「GPUコンピューティング」を実現するための仕組みがCUDAです。
一般的にはCUDAコア数が多ければ多いほど、GPUの性能が高くなるといわれています。CUDAコアは映像関連処理に特化している演算回路であるため、CUDAコア数が多いとGPUの画像処理機能の性能が高くなる可能性があります。
【②Tensor(テンソル)はディープラーニングに特化した行列演算回路 】
Tensorコアとは、AI(人工知能)や大量のデータに対して複雑な演算処理を高速に行うHPCなどのディープラーニングに特化した演算回路です。「行列演算」という演算処理を行っており、2017年NVIDIAのGPU(Volta世代)から採用された技術です。
CUDAコアは映像関連処理に特化した演算回路であるのに対し、Tensorコアは深層学習に特化している演算回路であるため、そもそも用途が異なります。高い精度での予測が必要な化学分野や気象学、デザインなど幅広い分野で利用されています。