製品情報

NVIDIA A40

世界で最もパワフルなビジュアルコンピューティング向けデータ センター GPU

  • 製品概要
  • 仕様
  • プロフェッショナル向け機能

製品概要

NVIDIA A40 GPU は、デザイン、クリエイティブ、科学における現代の課題に対処するためのパワフルな計算処理能力、
パワフルな AI 活用によりこのクラスで最高のプロフェッショナル グラフィックスを兼ね備え、データ センターの
パフォーマンスおよびマルチワークロード機能としては革新的な飛躍を遂げています。
次世代の仮想ワークステーションとサーバーベース ワークロードを推進する NVIDIA A40 は、場所と時間を問わず、
レイ トレーシング レンダリング、シミュレーション、仮想プロダクションなどの最先端の機能を
プロフェッショナルに提供します。

NVIDIA Ampere アーキテクチャのパワー

  • NVIDIA Ampere アーキテクチャ
    CUDA® コア

    単精度浮動小数点(FP32)操作の処理速度が2 倍になり、電力効率が改善されたことで、複雑な3D CAD(コンピューター支援デザイン)やCAE(コンピューター支援エンジニアリング)など、グラフィックスやシミュレーションのワークフローのパフォーマンスが大幅に向上します。

  • 第3世代 NVIDIA NVLink®

    最大2つのNVIDIA A40 GPUをつなげて、GPUメモリを48GBから96GBに拡張できます。GPUとGPUの相互接続により帯域幅が増えたことで、単独のスケーラブルメモリでグラフィックスや計算処理ワークロードを加速し、大規模データセットを処理できます。新しいNVLinkコネクタは一層コンパクトになったことで、利用できるサーバーの幅が広がります。

  • 第2世代RTコア

    前世代に比べてスループットが2倍になり、シェーディング機能またはノイズ除去機能とレイ トレーシングを同時実行できる第2世代RTコアは、映画コンテンツを写真のようにリアルなレンダリング、建築設計の評価、製品設計の仮想プロトタイピングなどのワークロードを大幅にスピードアップします。 この技術はまた、レイ トレーシングされるモーションブラーのレンダリングスピードを上げます。迅速に結果を出し、映像的な精度が向上します。

  • 仮想化対応(*1)

    NVIDIA 仮想GPU(vGPU)ソフトウェアによる次世代の機能改善により、リモートユーザーに与えられる仮想ワークステーションインスタンスが今までより大規模に、パワフルになりました。高性能のリモートデザイン、AI、コンピューティングが可能です。
    *1 NVIDIA A40 GPU の仮想化サポートは今後のvGPUリリースでサポートされます。

  • 第3世代Tensorコア

    新しいTensor Float 32(TF32)精度は前世代に比べてトレーニングスループットが5倍になり、コードを変更する必要なく、AIとデータ サイエンスのモデルトレーニングを高速化します。スパース構造に対するハードウェアサポートにより、推論のスループットが2倍になります。Tensorコアはまた、DLSS、AIノイズ除去、特定のアプリケーション向けの拡張編集などの機能を備えたグラフィックにAIをもたらします。

  • PCI Express Gen.4

    PCI Express Gen.4はGen.3 に比べて帯域幅が2倍であり、AI、データサイエンス、3Dデザインなど、データが集中的に使用されるタスクで、CPUメモリからのデータ転送速度を上げます。PCI Expressそのもののパフォーマンスが速くなったことで、GPU DMA(ダイレクト メモリ アクセス)も速くなりました。GPUとGPUDirect® for Video対応デバイスの間でビデオデータのI/O通信が速くなり、ライブ配信にとってパワフルなソリューションとなります。NVIDIA A40とPCI Express Gen.3 の間には後方互換性があり、導入が柔軟になります。

  • 48GB の GPU メモリ

    超高速GDDR6メモリ(NVLinkにより最大96GBまで拡張可能)は、データサイエンティスト、エンジニア、クリエイターにデータサイエンスやシミュレーションなど、大量のデータセットやワークロードを操作するために必要な大規模メモリを提供します。

  • データ センターの効率性とセキュリティ

    デュアルスロットを備え、電力効率に優れた設計のNVIDIA A40 は前世代に比べて電力効率が2倍であり、さまざまなワークステーションに適合するように設計されています。GPU内のHardware Root of Trustテクノロジーを利用したSecure / Measured Bootにより、データセンターのセキュリティ層がさらに厚くなります。

仕様

CUDA Cores 10752
Tensor Cores 336(第3世代)
RT Cores 84(第2世代)
GPU クロック(MHz) ベース: 1305
ブースト: 1740
メモリ容量 48GB GDDR6
メモリインターフェイス(bit) 384
メモリクロック(MHz) 7251
メモリ帯域幅(GB/s) 696
対応拡張スロット PCI Express 4.0 x16
コンピュートAPI NVIDIA CUDA / DirectCompute / OpenCL / OpenACC
出力コネクタ (*1) DisplayPort (1.4) x3, NVIDIA Mosaic と Quadro Sync 対応
グラフィックスAPI DirectX 12,Shader Model 5.1,OpenGL 4.6,Vulkan 1.2
適合規格 WHQL / ISO9241 / EU RoHS / JIG / REACH / HF / WEEE / RCM / BSMI /CE / FCC / ICES / KC / cUL, UL / VCCI
対応OS Windows Server 2019, Windows Server 2022, Windows10 64bit(*2) , Windows11, Linux 64bit
最大消費電力 300 W
補助電源コネクタ仕様 CPU 8pin(*4)
外形寸法(mm)
ブラケット含まず
267.7 x 111.2、ATX、2スロットサイズ
付属品 PCIe 8pin×2 – CPU 8pin x1 補助電源変換ケーブル × 1

(*1) デフォルトで仮想化用に設定されていおり、物理ディスプレイコネクタは無効になっています。管理ソフトウェアツールを使って有効にできます。
(*2) バージョン1809以降を推奨
(*4) 6ピン/8ピンのPCI Express用補助電源とCPU 8ピン補助電源コネクタは形状が異なります。

理論演算性能値
FP64 (TFLOPS) 0.58464
FP64 Tensor Core (TFLOPS) N/A
FP32 (TFLOPS) 37.4
FP16 (TFLOPS) 37.4
TF32 Tensor Core (TFLOPS) 74.8 149.6(*3)
BFLOAT16 Tensor Core (TFLOPS) 149.7 299.4(*3)
FP16 Tensor Core (TFLOPS) 149.7 299.4(*3)
INT8 Tensor Core (TOPS) 299.3 598.6(*3)
INT4 Tensor Core (TOPS) 598.7 1197.4(*3)

(*3) 構造化スパースを適用

対応機能
Multi-Instance GPU Support (Max Instance) ×
ECC 対応
NVLink 対応 112GB/s (第3世代)
製品内容
  • NVIDIA® A40
  • 製品保証書
保証期間
  • 3年間保証
製品名・型番・JANコード
製品名 NVIDIA A40 NC NVIDIA A40
型番 ETSA40-48GER2 ETSA40-48GER
JANコード 4524076071369 4524076071024
価格
  • オープンプライス
オプション製品
A40用NVLinkブリッジ
型番 P3412
製品名 NVIDIA NVLink Bridge 2-Slot (for Ampere) Retail
JAN コード 4524076030311

プロフェッショナル向け機能

マルチディスプレイ テクノロジ

複数の 8K モニターのサポート、NVIDIA Mosaic のマルチディスプレイ テクノロジとベゼル補正、 NVIDIA の Warp and Blend SDK は、大規模な Cave Automatic Virtual Environment (CAVE)、ビデオ ウォール、バーチャルセットとブロードキャスト、ロケーションベースのエンターテインメント構築を推進します。

 

Quadro Sync

NVIDIA Quadro Sync テクノロジは、複数の NVIDIA A40 GPU とディスプレイまたはプロジェクターを同期することで、大規模のビジュアライゼーションが実現します。

 

無制限ビデオ ストリーム

専用のビデオ エンコーダー エンジン (NVENC) とデコーダー エンジン (NV DEC) は、複数のストリームを同時に使用する、ビデオを短時間でエクスポートする、そして、ブロードキャスト、セキュリティ、ビデオ サービングにマルチストリーム ビデオ アプリケーションを使用するために必要なパフォーマンスを提供します。

 

臨場感のある VR

グラフィックスを高速化し、ディスプレイの帯域幅を上げたことは、高解像度の HMD (ヘッド マウント ディスプレイ) で、没入感が最も高い拡張現実 (AR) 体験と仮想現実 (VR) 体験の動力源となります。2 つの NVLink を接続した GPU を 4 方向 VR SLI で左右の目に割り当てることでピーク パフォーマンスを達成します。

 

エンタープライズ品質のドライバー

Quadro Virtual Data Center Workstation (Quadro vDWS) ソフトウェア搭載の仮想ワークステーションは物理ワークステーションと同じ Quadro プラットフォームを活用します。さまざまな産業用途で広範囲のテストを行い、100 社を超える独立系ソフトウェア ベンダー (ISV) から認定を受けており、最適なパフォーマンスと安定性が得られます。

 

EGX サーバー

NVIDIA A40 と NVIDIA vGPU ソフトウェアは次世代 NVIDIA EGX™ サーバーの中心であり、場所を問わず、プロフェッショナルなグラフィックスとコンピューティングにパワーを与えるパフォーマンスと機能を提供します。

EGXサーバーの詳細はこちらから

© NVIDIA Corporation. All Rights Reserved. NVIDIA, NVIDIA logo, Tesla, and CUDA are registered trademarks and/or trademarks of NVIDIA Corporation in the United States and other countries. Other company and product names may be trademarks of the respective companies with which they are associated.