생성 데이터 인텔리전스

LANL은 Nvidia의 GH200으로 가득 찬 Venado super를 강화합니다.

시간

LANL(Los Alamos National Laboratory)은 에너지부의 AI 워크로드를 처리하기 위해 10엑사플롭스의 성능을 제공할 수 있는 Venado 슈퍼컴퓨터의 스위치를 바꿨습니다.

2022년 ISC 고성능 컴퓨팅 컨퍼런스에서 발표된 Venado는 첫 번째 중 Nvidia의 Superchip 아키텍처를 사용하여 슈퍼컴퓨터를 구축할 예정입니다. 하지만 주장된 성능에 너무 기대하기 전에 exaFLOP 지표는 AI 워크로드에만 적용된다는 점을 기억하세요.

만큼 강력한 사슴 즉, Nvidia는 AMD의 1.1 exaFLOP를 무너뜨리지 못했습니다. 프론티어 시스템 – 사실 가깝지도 않아요. 부동 소수점 성능은 지난 30년 동안 Top500 고성능 Linpack(HPL) 실행에서 볼 수 있듯이 오랫동안 슈퍼컴퓨터의 벤치마크였습니다. 그러나 낮은 정밀도와 AI 워크로드에 맞춰진 시스템이 등장하면서 측정항목의 의미가 다소 모호해졌습니다.

Top500 순위에 나열된 배정밀도 성능 대신 AI 워크로드를 실행하도록 설계된 많은 시스템의 최고 부동 소수점 성능 등급은 종종 절반(FP16) 또는 심지어 8/XNUMX(FPXNUMX) 정밀도로 제공됩니다.

Venado는 FP8을 사용하여 평가되었습니다.

따라서 더 높은 처리량과 더 낮은 메모리 대역폭을 위해 정확도를 교환하는 조건에서 실행할 때 높은 10exaFLOP 수치가 달성되었습니다. 이는 LLM(대규모 언어 모델) 및 기타 기계 학습 작업을 실행하는 데 적합하지만, 중요도를 시뮬레이션하려는 경우에는 최선의 옵션이 아닐 수도 있습니다. 플루토늄 탄두.

Venado는 FP64 워크로드에서 Frontier를 따라잡을 수는 없지만, 그렇다고 해서 나쁠 것은 없습니다. 시스템 성능의 대부분을 제공하는 Nvidia의 H100 GPU 덕분에 이 시스템은 약 171페타플롭의 최고 배정밀도 성능을 생성할 수 있어야 합니다. 이는 10월 Top500 순위에서 XNUMX위를 차지한 시스템을 간신히 제칠 만큼 충분합니다. HPL의 실제 성능은 일반적으로 상당히 낮습니다.

에너지부 차관인 David Turk는 "인공 지능 접근 방식을 통합할 수 있는 능력을 통해 Los Alamos의 Venado 시스템이 어떻게 관심 분야에 새롭고 의미 있는 결과를 제공할 수 있는지 기대하고 있습니다"라고 말했습니다. 성명서.

LANL은 지난 달에 제공된 시스템이 이미 재료 과학 및 천체 물리학 시뮬레이션을 실행할 가능성을 보여주었다고 말합니다. 이는 해당 기계가 HPC 시뮬레이션을 공평하게 수행하고 정밀도가 낮은 AI 워크로드를 처리한다는 것을 보여줍니다.

LANL의 Nicholas C Metropolis 모델링 및 시뮬레이션 센터에 위치한 Venado는 Nvidia 및 HPE Cray의 EX 플랫폼과 Slingshot 11 상호 연결을 사용하여 협력하여 구축한 비교적 컴팩트한 시스템입니다.

전체 수냉식 시스템은 3480개의 GH2,560 및 200개의 Grace-Grace CPU 모듈을 포함하여 920개의 Nvidia Superchip으로 구성됩니다.

우리처럼 논의 된 과거에 GH200은 기본적으로 HPC 및 AI 워크로드를 겨냥한 시스템 온 모듈이었습니다. Nvidia의 고급 Neoverse V72 코어, 2GB LPDDR480x 메모리, 5GB/초 NVLink-C96C 상호 연결과 함께 연결된 144GB 또는 100GB H900 GPU를 기반으로 하는 2코어 Grace CPU를 갖추고 있습니다.

Nvidia의 Grace CPU 슈퍼칩은 GPU를 두 번째 Grace CPU로 교체하여 동일한 NVLink-C144C 상호 연결로 연결된 총 2개의 코어를 제공합니다. 이러한 코어에는 최대 960TB/초의 대역폭을 제공할 수 있는 최대 5GB의 LPDDR1x 메모리가 제공됩니다.

LANL에 따르면 이러한 Grace CPU 슈퍼칩은 광범위한 HPC 애플리케이션, 특히 최적화되지 않았거나 GPU 가속기에 적합하지 않은 애플리케이션의 성능을 향상시켜야 합니다.

Arm 기반 시스템으로 인해 HPC 직원이 서둘러 재교육이 필요하다고 생각할 수도 있지만, 우리의 자매 사이트처럼 다음 플랫폼 이전에 논의 된 – 슈퍼컴퓨팅 커뮤니티는 Cavium의 ThunderX 및 Fujitsu의 A64FX 플랫폼으로 거슬러 올라가 한동안 Arm 시스템을 사용해 왔습니다.

Venado는 올해 우리가 볼 수 있는 가장 큰 Grace-Hopper 시스템도 아닐 것입니다. 영국 정부의 Isambard-AI는 powered 5448 엔비디아 GH200. 한편, EuroHPC의 Jupiter System의 GPU 파티션은 Grace-Hopper 슈퍼칩은 24,000개에 가깝습니다. ®

spot_img

최신 인텔리전스

spot_img