- TOP
- 製品情報
- PCI Express拡張システムシリーズ
- H3 Falconシリーズ
- Falcon 4210 / 4010
製品情報
Falcon 4210 / 4010
柔軟な構成が可能な4スロット搭載ドロワー×2基内蔵のPCI Express 4.0対応拡張ボックス
- 製品概要
- 仕様
- ホスト - ターゲット間の
接続イメージ - NVIDIA A100
テストレポート - ダウンロード
製品概要
ニーズに見合った柔軟な調整が可能な優れたリソース共有機能
H3 Falconシリーズは、PCI Express 4.0規格に対応し複数のホストで複数のデバイスをダイナミックに共有することが可能なデバイス拡張ボックスです。管理者が簡単な操作を行うだけであるホストからリソースを削除して別のホストへ簡単に追加したり、適切な場所に適切なタイミングで再配置することが可能です。 管理者は専用のアプリ上から簡単でインテリジェントに調整や変更が可能になり、まとまりのあるハードウェアおよびソフトウェアソリューションを活用する事ができます。
Falconシリーズを使用すると、デバイスのセットアップ時間を大幅に節約できます。
最新・最速のPCI Express 4.0搭載
実際にデバイスが市販されている規格としては最新(2021年1月現在)のPCI Express 4.0を利用可能。PCI Express 3.0からの移行に伴い、手持ちの複数のPCIe Express 3.0アクセラレーターのトラフィックを集約しPCI Express 4.0の帯域をフルに活用してサーバーに接続することが可能になりました。
NVIDIA RTX A6000をはじめとするPCI Express 4.0ネイティブのアクセラレーターへ換装して更にスループットを上げることも可能です。
システムコントロールセンターでレベルの高い可視化を実現
システムの状態と使用状況をひと目で監視できるコントロールセンターを使用し、リアルタイムにパフォーマンスと使用状況が取得できます。
数回クリックするだけで、高負荷の状態のサーバーから低負荷の状態のサーバーへリソースを転送することが可能です。この可視化により、必要な情報を迅速かつ正確に取得できます。 簡素化された情報は、管理者がパフォーマンスの問題の原因を追跡し、将来のサービス中断を未然に防止するための詳細で簡単な図と表で表示されます。
高速にデータを移動してシステムパフォーマンスを最適化
H3 Falconシリーズは複数のGPUを統合し強力なHPCソリューションを提供します。NVMe SSDからGPUへ直接アクセスが可能なメカニズムを利用することでGPUパフォーマンスの向上が図れます。 アプリケーションがデータを要求した際にこの機能が動作するとNVMeコントローラのDMAエンジンが働き、NVMeからGPUにデータを直接移動することで不要なメモリーコピーがなくなります。これによりCPUのオーバーヘッドが削減され、待ち時間が短縮されてアプリケーションのデータ転送時間が大幅に改善されます。
Falconシリーズ管理ツール「H3 Center」を利用することで効率的な運用が可能に
Falconシリーズ管理ツール「H3 Center」は、対象システムに追加・移動・削除されたデバイスを自動的に検出します。「H3 Center」のダッシュボード上からは、アラート/使用率/パフォーマンス/ヘルスステータスなどが確認可能です。
PCI Expressデバイスのダイナミックな供給を実現
H3 Falconシリーズに格納されたGPUは「H3 Center」上で作成した共有エリアによってグループ化されます。リソース管理者は、必要な時に必要な数のGPUを 「H3 Center」 上からピックアップすることで、Falconシリーズそのものや接続先のサーバーをシャットダウンすることなくお使い頂くことが可能です。利用が終われば、いつでも共有エリアに戻すことが可能です。
リソースの最適利用とすぐれた障害予測を実現
AIを搭載した管理ツールである「H3 Center」は、GPUの使用率やパフォーマンスなどの集中分析が表示でき、また、エラーを継続的に監視することにより、問題の迅速な解決と信頼性の向上がを実現可能となります。
エルザ ジャパンはH3社のCertified Partnerです。
仕様
モデル | H3 Falcon 4210 | H3 Falcon 4010 | ||
---|---|---|---|---|
製品名 | H3 Falcon 4210 2Host | H3 Falcon 4010 2Host | ||
製品型番 | ELFG42001H02D10P21600 | ELFG41001H02D10P21600 | ||
JANコード | 4524076972154 | 4524076972130 | ||
筐体内 スロット数 |
||||
ドロワー | システム内に2基搭載、PCI Express 4.0 x16: 8スロット (ドロワー1基あたり4スロット/全スロットに2スロット幅GPU搭載可能) |
|||
本体 | PCI Express 4.0 x16: 2スロット (ロープロファイルのみ対応、装着可能最大寸法 高さ64.41mm×奥行230mm/1スロット幅) |
|||
1スロットあたりの 供給可能な最大電力 |
450W(※1) | 300W | ||
スイッチチップ | Broadcom PEX88096 PCI Express 4.0 switch | |||
対応 PCI Express 規格 |
Gen.4.0 | |||
BMC/mCPU | Aspeed AST2500 | |||
冷却システム | 120角x38(mm)ファン ×6基(最大6400rpm) | |||
電源ユニット | 1600W PSU (200V使用時)/1000W(100V使用時)×2基 | |||
外形寸法 | 5U 約440×約220×約510(W×H×D/mm)(突起物・ハンドル含まず) | |||
本体質量 | 約25kg(内蔵カード類含まず) | |||
ホストカード | PCI Express Gen4 ×4対応、高さ 約68㎜×奥行 約175㎜、ロープロファイル規格準拠 (詳細はお問い合わせください) |
|||
本体との接続 コネクター形状 |
mini-SAS HDコネクター(SFF-8644) | |||
サポートOS | Microsoft Windows 10 Pro(Build 1903)/ RHEL / CentOS 7.2~7.6、Ubuntu 18.04LTS |
動作確認デバイス
GPU / アクセラレーター | NVIDIA A100、A40、V100、P100およびT4 |
---|---|
ストレージ | Intel P4800X、P4600、P4500シリーズ Samsung PM1725a、PM1725b、PM1733シリーズ |
ネットワーク | Mellanox ConnectX-4、ConnectX-5 |
ソフトウェア機能
機能 | GPU Dynamicaliy provisioning Device surprise add and remove Device peer to peer (GPU P2P) PCI Express port configuration Performance and error monitoring |
---|---|
マネージメント インターフェース | Redfish®, RESTful API, GUI |
サポートブラウザー | Google Chrome, Microsot Edge, Mozilla Firefox |
システム マネージメント | H3 Management Center Real-time GPU cluster topology Dashboard for GPU utilization. Performance and other info Predictive health monitor Role-based authentication and access contorol |
ホスト - ターゲット間の
接続イメージ
下図の様な接続形態をご利用頂けます。詳しくは担当営業までご相談ください。
※以下のアドバンストモードでご利用されるためには別途有償ライセンスが必要です。
NVIDIA A100
テストレポート
PCIe版NVIDIA A100の動作
この実験では、PCIe Gen.3のインテル Xeon Gold 5120TとPCIe Gen.4のAMD EPYC 7452の2つの異なるサーバを使用し、PCIe版A100 GPUをFalcon 4010プラットフォームを介してホストに接続し、両方の環境でCUDAサンプルコマンドを実行しました。
※画像をクリックすると導入事例PDFをダウンロードいただけます。