Üretken Veri Zekası

LANL, Nvidia'nın GH200 paketli Venado süper cihazına güç veriyor

Tarih:

Los Alamos Ulusal Laboratuvarı (LANL), Enerji Bakanlığı'nın yapay zeka iş yüklerini karşılamak için on exaFLOPS performansı sunabilen bir makine olan Venado süper bilgisayarındaki anahtarı çevirdi.

2022'de ISC yüksek performanslı bilgi işlem konferansında duyurulan Venado, ilkler arasında Süper bilgisayarlar Nvidia'nın Superchip mimarisi kullanılarak oluşturulacak. Ancak iddia edilen performans konusunda çok heyecanlanmadan önce exaFLOP metriğinin yalnızca AI iş yükleri için geçerli olduğunu unutmayın.

O kadar güçlü geyik Nvidia, AMD'nin 1.1 exaFLOP'unu tahtından indiremedi Sınır sistemi – aslında yakın bile değil. Geçtiğimiz 30 yıllık Top500 Yüksek Performanslı Linpack (HPL) çalıştırmalarında görüldüğü gibi, kayan nokta performansı uzun süredir süper bilgisayarlar için bir referans noktası olmuştur. Ancak daha düşük hassasiyetlere ve yapay zeka iş yüklerine göre uyarlanmış sistemlerin yükselişiyle birlikte metriğin anlamı biraz bulanıklaştı.

Top500 sıralamasında listelenen çift duyarlıklı performans yerine, yapay zeka iş yüklerini çalıştırmak için tasarlanan birçok sistemin en yüksek kayan nokta performans derecelendirmesi genellikle yarı (FP16) ve hatta çeyrek (FP8) hassasiyetle verilir.

Venado FP8 kullanılarak derecelendirildi.

Dolayısıyla bu yüksek onluk exaFLOP rakamına, doğruluğun daha yüksek verim ve daha düşük bellek bant genişliği ile değiş tokuş edildiği koşullar altında çalışırken ulaşıldı. Bu, büyük dil modellerini (LLM'ler) ve diğer makine öğrenimi görevlerini yürütmek için mükemmeldir, ancak bir dilin kritikliğini simüle etmeye çalışıyorsanız en iyi seçenek olmayabilir. plütonyum savaş başlığı.

Her ne kadar Venado, FP64 iş yüklerinde Frontier'a bir mum tutamasa da, bu hiç de beceriksiz değil. Sistemin gücünün büyük kısmını sağlayan Nvidia'nın H100 GPU'larının varlığı sayesinde, makinenin yaklaşık 171 petaFLOP çift duyarlıklı performans sergileyebilmesi gerekiyor; bu, Kasım ayının Top10 sıralamasında 500. sıradaki sistemi zar zor geçmeye yetiyor. Ancak HPL'deki gerçek performansın genellikle biraz daha düşük olduğunu belirteceğiz.

Enerji Bakanlığı sekreter yardımcısı David Turk, "Yapay zeka yaklaşımlarını birleştirme yeteneği sayesinde Los Alamos'taki Venado sisteminin ilgi alanları için nasıl yeni ve anlamlı sonuçlar sunabileceğini görmek için sabırsızlanıyoruz" dedi. ifade.

LANL, geçen ay teslim edilen sistemin şu ana kadar malzeme bilimi ve astrofizik simülasyonları yürütme konusunda umut verici olduğunu söylüyor. Bu, makinenin HPC simülasyonlarından payına düşeni alacağını ve daha düşük hassasiyetli yapay zeka iş yükleriyle başa çıkacağını gösteriyor.

LANL'nin Nicholas C Metropolis Modelleme ve Simülasyon Merkezi'nde yer alan Venado, Nvidia ve HPE Cray ile işbirliği içinde, ikincisinin EX platformunu ve Slingshot 11 ara bağlantılarını kullanarak oluşturulmuş nispeten kompakt bir sistemdir.

Tamamı sıvı soğutmalı sistem, 3480 GH2,560 ve 200 Grace-Grace CPU modülü dahil olmak üzere 920 Nvidia Süper Çipinden oluşuyor.

Bizim gibi tartışılan Geçmişte, GH200 aslında HPC ve AI iş yüklerini hedefleyen modül üzerinde bir sistemdi. Nvidia'nın üst düzey Neoverse V72 çekirdeklerini temel alan 2 çekirdekli Grace CPU'ya, 480 GB LPDDR5x belleğe ve 96 GB/sn NVLink-C144C ara bağlantısıyla birbirine bağlanan 100 veya 900 GB H2 GPU'lara sahiptir.

Nvidia'nın Grace CPU Süper Çipleri, aynı NVLink-C144C ara bağlantısıyla bağlanan toplam 2 çekirdek için GPU'yu ikinci bir Grace CPU ile değiştiriyor. Bu çekirdekler, 960 TB/sn'ye kadar bant genişliği sunabilen 5 GB'a kadar LPDDR1x bellekle beslenir.

LANL'ye göre bu Grace CPU Süper Çipleri, özellikle optimize edilmemiş veya GPU hızlandırıcılara pek uygun olmayanlar olmak üzere çok çeşitli HPC uygulamaları için performansı artırmalıdır.

Arm tabanlı bir sistemin, kardeş sitemiz olarak HPC uzmanlarının aceleyle yeniden beceri kazanmaları gerektiği anlamına gelebileceğini düşünebilirsiniz. Bir Sonraki Platform önceden var tartışılan – süper bilgi işlem topluluğu, Cavium'un ThunderX ve Fujitsu'nun A64FX platformlarına kadar uzanan bir süredir Arm sistemleriyle çalışıyor.

Venado bu yıl gördüğümüz en büyük Grace-Hopper sistemi bile olmayacak. Birleşik Krallık Hükümeti'nin Isambard-AI'si powered 5448 Nvidia GH200s tarafından. Bu arada, EuroHPC'nin Jüpiter Sisteminin GPU bölümü paket 24,000'e yakın Grace-Hopper Süper Çipi. ®

spot_img

En Son İstihbarat

spot_img