Üretken Veri Zekası

Üç yeni NVIDIA GPU tabanlı Amazon EC2 bulut sunucusuyla tanışın | Amazon Web Hizmetleri

Tarih:

Amazon Elastik Bilgi İşlem Bulutu (Amazon EC2) hızlandırılmış bilgi işlem portföyü, yapay zeka (AI), makine öğrenimi (ML), grafik ve yüksek performanslı bilgi işlem (HPC) iş yüklerinizi güçlendirmek için en geniş hızlandırıcı seçeneklerini sunar. Bu portföyün en yeni NVIDIA GPU'ları içeren üç yeni bulut sunucusuyla genişletildiğini duyurmaktan heyecan duyuyoruz: NVIDIA H2 GPU'lar tarafından desteklenen Amazon EC5 P200e bulut sunucuları, NVIDIA L2 GPU'lar içeren Amazon EC6 G4 bulut sunucuları ve NVIDIA L2S GPU'lar tarafından desteklenen Amazon EC6 G40e bulut sunucuları. Her üç bulut sunucusu da 2024'te satışa sunulacak ve onlarla neler yapabileceğinizi görmek için sabırsızlanıyoruz.

AWS ve NVIDIA, 13 yılı aşkın bir süredir iş birliği yapıyor ve geliştiriciler ve kuruluşlar için geniş ölçekli, yüksek performanslı ve uygun maliyetli GPU tabanlı çözümlere öncülük ediyor. NVIDIA'nın güçlü GPU'larını aşağıdaki gibi farklı AWS teknolojileriyle birleştirdik: AWS Nitro Sistemi, 3,200 Gb/sn Elastik Kumaş Adaptörü (EFA) v2 ağı, yüzlerce GB/sn veri çıkışı Lustre için Amazon FSxAI/ML, grafik ve HPC için en performanslı altyapıyı sunmak üzere Amazon EC2 UltraClusters ile exascale bilgi işlem. Aşağıdakiler gibi diğer yönetilen hizmetlerle birlikte Amazon Ana Kayası, Amazon Adaçayı Yapıcı, ve Amazon Elastik Kubernetes Hizmeti (Amazon EKS) ile bu bulut sunucuları, geliştiricilere üretken yapay zeka, HPC ve grafik uygulamaları oluşturma ve dağıtma konusunda sektörün en iyi platformunu sağlar.

Yapay zeka, HPC ve grafik iş yükleri için yüksek performanslı ve uygun maliyetli GPU tabanlı örnekler

EC2 P5e bulut sunucuları, en büyük büyük dil modellerinin (LLM'ler) geliştirilmesini, eğitimini ve çıkarımını desteklemek için, H200 GPU'lardan 141 kat daha büyük ve 3 kat daha hızlı olan 1.7 GB HBM1.4e GPU belleği sunan NVIDIA'nın en yeni H100 GPU'larını içerecektir. . GPU belleğindeki bu artış ve AWS Nitro System tarafından etkinleştirilen 3200 Gbps'ye kadar EFA ağı, AWS'de son teknoloji modellerinizi oluşturmaya, eğitmeye ve dağıtmaya devam etmenizi sağlayacaktır.

NVIDIA L2S GPU'lara sahip EC6 G40e bulut sunucuları, geliştiricilere genel kullanıma açık LLM'lerin eğitimi ve çıkarımı için geniş çapta kullanılabilir bir seçenek sunmanın yanı sıra Küçük Dil Modellerinin (SLM) giderek daha fazla benimsenmesini desteklemek üzere tasarlanmıştır. Ayrıca, 3D araçlar ve uygulamalar genelinde tanımlama ve simülasyon yapmak ve endüstriyel dijitalleştirmeye yönelik sanal dünyalar ve gelişmiş iş akışları oluşturmak için NVIDIA Omniverse'i kullanan dijital ikiz uygulamalar için de idealdir.

NVIDIA L2 GPU'lara sahip EC6 G4 bulut sunucuları, doğal dil işleme, dil çevirisi, video ve görüntü analizi, konuşma tanıma ve kişiselleştirmenin yanı sıra aşağıdaki grafik iş yükleri için ML modellerinin dağıtımına yönelik daha düşük maliyetli, enerji açısından verimli bir çözüm sunacak: gerçek zamanlı, sinema kalitesinde grafikler ve oyun akışı oluşturma ve işleme.


Yazar Hakkında

Çetan Kapoor Amazon EC2 Hızlandırılmış Bilgi İşlem Portföyünün Ürün Yönetimi Direktörüdür.

spot_img

En Son İstihbarat

spot_img