NVIDIA® Quadro GV100 32GB HBM2 PCIE
NVIDIA QUADRO GV100
PUISSANCE INÉGALÉE. LIBERTÉ DE CRÉATION INÉGALÉE.
L’IA, le rendu photo réaliste, la simulation et la réalité virtuelle transforment les flux de travail professionnels. Les ingénieurs peuvent désormais créer des produits révolutionnaires plus rapidement. Les architectes peuvent concevoir des bâtiments qui n’auraient pu exister que dans leur imagination. Et les artistes peuvent restituer des scènes photoréalistes complexes en quelques secondes au lieu de quelques heures. Alors que les applications continuent d’être améliorées avec ces technologies, les outils informatiques professionnels doivent suivre le rythme.
La NVIDIA ® Quadro ® GV100 réinvente la station de travail pour répondre aux exigences de ces workflows de nouvelle génération. Il est alimenté par NVDIA Quadro Volta, offrant la capacité de mémoire, l’évolutivité et les performances extrêmes dont les concepteurs, les architectes et les scientifiques ont besoin pour créer, construire et résoudre l’impossible.
Basé sur un processus de fabrication haute performance 12 nm FFN (FinFET NVIDIA) personnalisé pour NVIDIA pour incorporer 5120 cœurs CUDA, le GPU NVIDIA Quadro GV100 est la plate-forme informatique la plus puissante pour les charges de travail HPC, AI, VR et graphiques sur les ordinateurs de bureau professionnels. Capable de fournir plus de 7,4 TFLOPS de double précision (FP64), 14,8 TFLOPS de simple précision (FP32), 29,6 TFLOPS de demi-précision (FP16), 59,3 TOPS de précision entière (INT8) et 118,5 TFLOP de tenseur capacité de fonctionnement, il prend en charge une large gamme de charges de travail à forte intensité de calcul sans faille.
Les nouveaux cœurs Tensor de précision mixte spécialement conçus pour l’arithmétique matricielle d’apprentissage en profondeur offrent une augmentation de 8 fois des performances TFLOPS pour l’entraînement, par rapport à la génération précédente. NVIDIA Quadro GV100 utilise 640 cœurs Tensor ; chaque Tensor Core effectue 64 opérations FMA (Fused Multiplicate Add) à virgule flottante par horloge, et chaque SM effectue un total de 1024 opérations individuelles à virgule flottante par horloge.
Points forts
Noyaux CUDA | 5120 |
Noyaux tenseurs | 640 |
Performances maximales du FP64 à double précision | 7.4 TFLOPS |
Performances de pointe du FP32 à simple précision | 14.8 TFLOPS |
Performances de pointe de la demi-précision FP16 | 29.6 TFLOPS |
Performances de fonctionnement en nombre entier maximal (INT8) | 59.3 HAUTS |
Apprentissage en profondeur TFLOPS | 118.5 TFLOPS |
Mémoire GPU | 32 Go HBM2 |
Interface mémoire | 4096 bits |
Bande passante de la mémoire | 870 Go/s |
Interface système | PCI Express 3.0 x16 |
Connecteurs d’affichage | DP 1.4 (4) |