NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0 stvoren za AI, nauku o podacima i superračunarstvo pokrenut s obećanim 90-postotnim performansama modela od 400 W

Hardver / NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0 stvoren za AI, nauku o podacima i superračunarstvo pokrenut s obećanim 90-postotnim performansama modela od 400 W 2 minute čitanja

Nvidia



NVIDIA je službeno lansirala A100, PCIe 4.0 kompatibilni GPU zasnovan na Ampere arhitekturi sljedeće generacije. Iako ima niži TDP profil od 250 W, NVIDIA obećava da će PCIe 4.0 Ampere A100 GPU moći ponuditi do 90 posto performansi punog 400 W A100 HGX GPU-a. Treća varijanta rastuće Ampere A100 GPU obitelji, A100 PCIe namijenjena je poslužiteljima s umjetnom inteligencijom (AI), Data Scienceom i Supercomputing klasterima.

NVIDIA je otkrila PCI-Express 4.0 varijantu A100 GPU-a. GPU se temelji na 7nm Ampere mikroarhitekturi. Osim toga, tvrtka je također najavila nekoliko sustava s pogonom na A100 vodećih proizvođača poslužitelja, uključujući Asus, Dell, Cisco, Lenovo i druge. GPU akcelerator od 250 W A100 PCIe 4.0 prilično je sličan punoj TW varijanti od 400 W, a NVIDIA također obećava gotovo identične performanse usprkos značajnom padu TDP profila.



NVIDIA A100 Ampere GPU u PCIe 4.0 obliku faktora s istom konfiguracijom 400 W A100 HGX GPU, ali na 250 W:

NVIDIA je najavila svoj PCIe 4.0 A100 PCIe GPU akcelerator. Ampere GPU dostupan je za raznolik niz slučajeva industrijske uporabe sa sustavima u rasponu od jednog A100 PCIe GPU-a do poslužitelja koji istovremeno koriste dvije kartice putem 12 NVLINK kanala koji isporučuju ukupno 600 GB / s propusnosti interkonekcije. GPU akcelerator od 250 W TDP A100 PCIe ne mijenja se puno u smislu konfiguracije jezgre u usporedbi s 400 W A100 HGX GPU.



GA100 GPU ima specifikacije 400W A100 HGX varijante s 6912 CUDA jezgri raspoređenih u 108 SM jedinica, 432 Tensor jezgre i 40 GB HBM2 memorije koja pruža istu propusnost memorije od 1,55 TB / s (zaokruženo na 1,6 TB / s). Međutim, raspoređivanje GPU paketa na PCIe 4.0 standard imao svoj vlastiti nedostatak znatno smanjiti TDP. To navodno znači 10 do 50 posto kazne za izvedbu na temelju radnog opterećenja. Štoviše, 250W TDP varijanta A100 GPU-a prikladnija je za kratke rafale, a ne za trajna opterećenja.

NVIDIA A100 Ampere GPU u izvedbi PCIe 4.0 oblika faktora:

Zahvaljujući značajnom smanjenju TDP profila, moglo bi se pretpostaviti da će kartica imati niže taktove kako bi nadoknadila manje TDP ulaza. Međutim, pokazatelji performansi koje je NVIDIA objavila uistinu su iznenađujući jer se približavaju 400W TDP varijanti. Izvedba FP64 i dalje je ocijenjena na 9,7 / 19,5 TFLOP-ova, izvedba FP32-a na 19,5 / 156/312 TFLOP-a (Sparsity), izvedba FP16-a na 312/624 TFLOP-a (Sparsity), a INT8 na 624/1248 TOP-ova ( Sparnost).



Jednostavna matematika ukazuje i NVIDIA osigurava da PCIe 4.0 250W A100 GPU zasnovan na Ampereu može pružiti 90 posto performansi A100 HGX kartice (400 W) u vrhunskim poslužiteljskim aplikacijama. To je opravdano jer je novoj varijanti potrebno manje vremena da dovrši gore spomenute zadatke. Međutim, brojevi bi trebali vrijediti samo u kraćim intervalima. U složenim situacijama koje zahtijevaju trajne mogućnosti GPU-a, 250W PCIe 4.0 GPU može isporučiti od 90 do 50 posto performanse 400 W A100 HGX GPU.

Ampereova mikroarhitektura zasigurno će koristiti novom A100. NVIDIA obećava barem 20X poboljšanje performansi u odnosu na prethodnika zasnovanog na Volti. PCIe 4.0 A100 GPU sadrži više instanci GPU tehnologije. To znači da se jedan A100 može podijeliti na čak sedam zasebnih GPU-ova za obradu različitih računalnih zadataka. Iako ovo pojačava segmentaciju, tu je NVLink 3. generacije, koji omogućuje spajanje nekoliko GPU-ova u jedan gigantski GPU.

Oznake nvidia