İşte bu, Nvidia Ampere GTC Keynote’u bitti. Jensen Huang, kendine özgü siyah deri ceketiyle geri döndü ve her şey dünyayla mükemmel bir şekilde gidiyordu. Hepimiz Nvidia CEO’sunun mutfağının içini gördük ve kaç tane spatulaya sahip olduğuna şaşırdık (dürüst olmak gerekirse, neden bu kadar çok spatula?).
Mutfak gereçleri bir yana, konuşma, otonom sürüşten tıbbi araştırmalara, konuşma yapay zekası ve robotiğe kadar her şeyi kapsayan sekiz videodan oluşuyordu, bunların hepsi Nvidia için önemli ama bizim için değil. , oyuncular. Tüm bunlardan sonra, Nvidia’nın yaklaşmakta olan oyun grafik kartları hakkında gerçek bir bilgi olmadığını düşünebilirsiniz. Oyun grafiklerinden birkaç söz edilirken, donanımın kendisi hakkında doğrudan bir ayrıntı yoktu.
Ancak GTC açılış konuşmasının sahip olduğu şey, A100 hakkında çok fazla ayrıntıydı. A100, veri merkezleri için tasarlanmış olsa da, aynı mimari gelecekte yeni nesil GeForce grafik kartlarına da yansıyacaktır.
En yüksek performans | |
---|---|
transistör sayısı | 54 milyar |
Kalıp ölçüsü | 826mm² |
FP64 CUDA renkleri | 3 456 |
Renkler FP32 CUDA | 6.912 |
Tensör renkleri | 432 |
Çok işlemcili akış | 108 |
GPU belleği | 40 GB |
GPU bellek bant genişliği | 1,6 TB/sn |
ara bağlantı | NVLink 600 Gb/sn | PCIe Gen 4 64 Gb/sn |
Çok örnekli GPU | 5 GB’de 7 MIG’ye kadar çeşitli bulut sunucusu boyutları |
Form faktörü | HGX A100’de 4/8 SXM GPU |
Maksimum enerji | 400W (SXM) |
A100’den büyük çıkarım, onun büyük bir çip olması ve sadece fiziksel boyutundan bahsetmiyorum, 826 mm karede etli olmasına rağmen, daha çok 54 milyar transistör içerdiği gerçeği. Nvidia’nın önceki veri merkezi teklifi Volta V100 olduğu için burada mevcut Turing mimarisiyle doğrudan karşılaştırma yapmak kolay değil, ancak yine de bazı ciddi performans iyileştirmeleri var. Nvidia, bazı görevlerde Volta’ya göre 20 kat performans artışı olduğunu iddia ediyor. Karşılaştırma için, bu çip 21,1 milyar transistöre sahipti ve 815 mm çapında ölçüldü. Yani A100’ün 2,5 kat daha fazla transistörü var ama sadece biraz daha büyük. Değerini gösteren, TSMC’nin 7nm sürecine atlamasıdır.
Gerçek zamanlı ışın izleme arıyorsanız, ikinci videoda çok sayıda Minecraft RTX görüntüsü ve… Marble RTX adlı lezzetli bir misket oyunu var. Ancak, veri merkezlerinde kullanılmadıkları için RT Cores ışın izleme tartışılmadı, ancak Tensor Core’un performansı önemli ölçüde artmış gibi görünüyor. (Her ne kadar değişmiş olsalar da, burada kolay bir karşılaştırma yoktur).
SM başına gerçek tensör çekirdeği sayısı dörde düştü (Turing’in sekizi vardı), ancak Nvidia hala bazı senaryolarda 2,5 kata kadar genel bir performans artışı iddia ediyor. Tensör performansının artacağına dair bu söylentiler paraya bağlı gibi görünüyor, genel olarak daha az çekirdek olmasını beklemiyorduk.
Tüm bunlar hakkında bilmediğimiz şey ise yeni nesil ekran kartlarında nasıl bir performans elde edeceğimiz. Bu noktada çekirdek sayısına, saat hızına veya buna benzer bir şeye sahip değiliz, ancak en son bilgiler için Nvidia Ampere hakkında bildiğimiz her şeyi kontrol ettiğinizden emin olun.