NVIDIA H100 NVL 94GB GPU z architekturą Hopper i PCIe 5.0 x16

Podsumowanie produktu
Karta graficzna NVIDIA H100 NVL 94 GB zapewnia 12 razy większą wydajność LLM w porównaniu z A100, ze 188 GB pamięci HBM3 w podwójnych konfiguracjach. Idealny do modeli GPT-175B, wyposażonych w silnik Transformer Engine i PCIe 5.0 do wydajnego wnioskowania AI i szkolenia na standardowych serwerach.
Podstawowe właściwości
Nazwa marki: NVIDIA
Numer modelu: 900-21010-0020-000
Nieruchomości handlowe
Minimalna ilość zamówienia: 10
Cena: 24000USD
Warunki płatności: T/T
Opis produktu
Karta graficzna NVIDIA H100 NVL 94GB
NVIDIA MPN: 900-21010-0020-000
Karta graficzna NVIDIA H100 NVL 94GB została zaprojektowana z myślą o demokratyzacji wnioskowania i trenowania dużych modeli językowych (LLM), przenosząc moc architektury Hopper do standardowych systemów serwerowych opartych na PCIe. Ta specjalistyczna wersja odpowiada na unikalne wymagania dotyczące pamięci i mocy obliczeniowej modeli z maksymalnie 175 miliardami parametrów, takich jak GPT-175B, zapewniając wyjątkową wydajność przy jednoczesnym zachowaniu efektywności operacyjnej w środowiskach centrów danych z ograniczonym poborem mocy.
Po wdrożeniu w konfiguracjach dwukartowych połączonych mostkami NVLink, H100 NVL zapewnia łączną pamięć HBM3 o pojemności 188 GB, umożliwiając parze kart graficznych działanie jako zunifikowana pula pamięci.
Specyfikacje techniczne
H100 NVL posiada 94 GB pamięci HBM3, zoptymalizowanej pod kątem intensywnych obciążeń wnioskowania i dostrajania dużych modeli językowych. Karta graficzna wykorzystuje pełne możliwości architektury Hopper, w tym Transformer Engine, który przyspiesza operacje LLM dzięki obliczeniom o mieszanej precyzji.
W porównaniu do systemów poprzedniej generacji, serwery wyposażone w karty graficzne H100 NVL wykazują do 12 razy wyższą wydajność na modelach GPT-175B niż konfiguracje NVIDIA DGX A100, ze znacznie poprawionymi charakterystykami opóźnień. Karta komunikuje się przez PCIe 5.0 x16 i obsługuje technologię NVLink za pośrednictwem mostków, umożliwiając komunikację GPU-GPU o bardzo wysokiej przepustowości, niezbędną do skalowania równoległości modeli na wielu akceleratorach.
Konstrukcja i kompatybilność
Zaprojektowana do standardowego wdrożenia w centrach danych, H100 NVL przyjmuje dwuslotowy format z opcjami chłodzenia aktywnego lub pasywnego, w zależności od konfiguracji OEM. Karta graficzna jest w pełni kompatybilna ze stosem oprogramowania korporacyjnego NVIDIA, w tym CUDA, TensorRT i pakietem NVIDIA AI Enterprise, zapewniając bezproblemową integrację z istniejącymi potokami AI.
Kluczowe zastosowania obejmują wnioskowanie w czasie rzeczywistym dla konwersacyjnej sztucznej inteligencji, dostrajanie modeli i obciążenia generowania rozszerzonego przez wyszukiwanie (RAG). Dzięki zrównoważonemu połączeniu pojemności pamięci, wydajności obliczeniowej i efektywności energetycznej, H100 NVL stanowi optymalny punkt wejścia dla organizacji, które chcą operacjonalizować duże modele językowe w swojej infrastrukturze, bez złożoności lub kosztów systemów opartych na gęstych modułach SXM.
Szczegóły produktu
Podkreślić:

Nvidia H100 PCIE GPU

,

94GB PCI GPU

,

PCIe 5.0 x16 GPU

Mr. Sales

Sales Department

ZAŁĄCZONE PRODUKTY
Wyślij zapytanie