Генеративный анализ данных

Intel готовит для Китая чипы Gaudi 3 с низким энергопотреблением

Дата:

Intel собирается выпустить две эксклюзивные для Китая модели своего ускорителя искусственного интеллекта Gaudi 3, но они будут существенно ограничены, чтобы соответствовать санкциям США.

О существовании двух моделей, допущенных к продаже в Поднебесной, подробно рассказывается в Технический документ Intel по Гауди 3. Сделанные для Китая процессоры, получившие названия HL-328 и HL-388, имеют форм-факторы OAM и PCIe соответственно: первый будет выпущен в июне, а второй — в сентябре, наряду с другим форм-фактором PCIe Gaudi 3.

В целом HL-328 и HL-388 выглядят более или менее так же, как и другие, с теми же 128 ГБ видеопамяти HBM2e с пропускной способностью 3.7 ТБ/с, 96 МБ кэш-памяти, интерфейсом PCIe 5.0 x16 и стандартами декодирования.

Единственная разница заключается в расчетной тепловой мощности, которая составляет 450 Вт как для моделей карт OAM, так и для карт PCIe. Это существенное снижение по сравнению с другими моделями. PCIe HL-338 не китайского производства имеет TDP 600 Вт, а форм-фактор OAM HL-325L и HL-335 — 900 Вт. Относительно низкий TDP китайских моделей Gaudi 3, по-видимому, является причиной отсутствия версии с жидкостным охлаждением.

Хотя это прямо не указано в техническом документе, внесение изменений почти наверняка было необходимо для соблюдения требований Экспортный контроль правительства США по процессорам, которые запрещают американским компаниям экспортировать чипы в Китай в зависимости от производительности. 

Мы не можем точно знать, что Intel сделала с Gaudi 3, чтобы сделать его совместимым, и насколько быстро эти одобренные для Китая чипы работают с этими изменениями, но есть некоторые подсказки. В HL-328 и HL-388 по-прежнему используются два кристалла, как и в других вариантах Gaudi 3, поскольку конфигурация памяти и кэша не изменилась. Использование двух кристаллов вместо одного помогает снизить плотность производительности, позволяя чипу достичь более высокого экспортного предела в 4,800 общих вычислительных мощностей (TPP).

Ограничение в 4,800 TPP означает, что ни один чип не может иметь производительность 150 терафлопс или более при 16-битной обработке, а поскольку Gaudi 3 может обеспечить производительность до 1,835 терафлопс на BF16, Intel придется серьезно снизить производительность. Это должно быть достигнуто за счет действительно значительного сокращения количества ядер и тактовой частоты или какого-либо другого метода ограничения производительности.

Мы запросили у Intel разъяснения по поводу эксклюзивных для Китая моделей Gaudi 3, но пока не получили ответа. Мы сообщим, если Intel раскроет какую-либо информацию.

Вероятно, мы можем ожидать, что HL-328 и HL-388 будут работать аналогично Нвидиа Н20, самый быстрый графический процессор кремниевого титана, одобренный для продажи в Китае. Его производительность FB148 и FP16 составляет 16 терафлопс, что чуть ниже предела в 150 терафлопс.

Поскольку чистая производительность ядра будет более или менее одинаковой между H20 и китайской моделью Gaudi 3, основная разница будет сводиться к памяти, у которой у Intel больше мощности, но немного меньше пропускной способности, и программному обеспечению, которое всегда было преимуществом. для чипов Nvidia. ®

Spot_img

Последняя разведка

Spot_img