NVIDIA Tesla M2090

NVIDIA Tesla M2090 は、1GPUあたり512個CUDA並列処理コアを搭載し、最高のパフォーマンスを実現するサーバー向けGPUコンピューティングモジュールです。

※本製品の販売は終了いたしました。

製品概要

NVIDIA Tesla M2090は、40nmプロセスルールを採用しGPUコンピューティングに特化した次世代のCUDA GPUアーキテクチャ「Fermi」を元に設計されたTesla GPUを搭載したGPUコンピューティングモジュールです。

TESLA T10シリーズGPUと比較して倍精度演算性能が約8.5倍と大幅に向上した他、キャッシュのサポート、シェアードメモリの増加、ECCメモリ搭載、マルチカーネルのサポートなど、HPCの分野において重要な機能を新たに多数サポートし、優れたパフォーマンスを実現します。

NVIDIA パラレルデータキャッシュ

NVIDIA Tesla M2090は、共有メモリ 16KB / L1キャッシュ 48KBまたは、共有メモリ 48KB / L1キャッシュ 16KBに構成が可変する、合計64KBの共有/L1キャッシュと、768KBのL2キャッシュ搭載しました。

*ECCを有効にすると、専用メモリの一部はECCビットに使用され、使用可能なユーザメモリは12.5%減少します。

ECCをサポートしたGDDR5メモリを搭載

搭載メモリには最新のGDDR5 SDRAM採用。高クロックで動作する超高速メモリを6GB搭載し、優れたパフォーマンスを実現します。*またエラーの検出と訂正を行うECC機能をサ ポートし、レジスターファイル、共有メモリ、L1、L2 キャッシュ、DRAMなどを保護します。

*注意:Windows XP (32/64bit)、Windows VISTA 32bit、Windows 7 32bit環境で使用する場合、OSの制限により約4.2GBまでしか認識いたしません。?
*ECCを有効にすると、専用メモリの一部はECCビットに使用され、使用可能なユーザメモリは12.5%減少します。

倍精度演算性能を大幅に強化

最新のFermiプロセッサは従来のTESLA T10シリーズGPUと比較して倍精度演算性能が6.6倍と大幅にパフォーマンスが向上。また浮動小数点演算が IEEE 754-2008 に準拠し、FMA 処理を単精度、倍精度ともにサポートしました。NVIDIA TESLA C1060に搭載されているT10 プロセッサではSM(Streaming Multi-processor)内に1基搭載されていたDPが、NVIDIA TESLA C2075に搭載されるFermiプロセッサではSP内にFPU を内蔵し、倍精度の場合 FPU を2個回して演算を行ないます。

マルチカーネルをサポート

新たに、データ転送のオーバーラップが可能なデュアルメモリトランスファエンジンと、従来のTESLA10シリーズGPUと比較して、切り替え速度が10倍速くなったコンテキストスイッチを搭載し、最大16カーネルの並列実行が可能になりました。

仕様

搭載GPU数1基
製品仕様
CUDAコアプロセッサ 512コア
浮動小数点 IEEE 754 単精度 / 倍精度浮動小数点 IEEE764-2008 サポート
単精度演算性能 665GFlops
倍精度演算性能 1.33TFlops
メモリ規格 GDDR5 SDRAM
メモリ容量 6GB
メモリI/F 384bit
メモリクロック 1.85GHz
メモリ転送帯域(ECC OFF) 1GPUあたり178GB / sec
バス PCI-Express x16 (PCI-Express 2.0対応)
ソフトウェア開発環境 CUDA ( C / C++ )
NVIDIA Parallel Nsight
Fortran
OpenCL
Direct Compute
対応OS RHEL 5.5 64bit / RHEL 6.0 64bit / RHEL 4.8 64bit
SLES 11.1 64bit
Ubuntu Linux 10.10 64bit
OpenSUSE 11.2 64bit
Fedora 13 64bit
Windows Server 2008 R2 64bit
  • Twitter 公式アカウント
  • Windows 10 対応ドライバは、こちら