Intel собирается выпустить две эксклюзивные для Китая модели своего ускорителя искусственного интеллекта Gaudi 3, но они будут существенно ограничены, чтобы соответствовать санкциям США.
О существовании двух моделей, допущенных к продаже в Поднебесной, подробно рассказывается в Технический документ Intel по Гауди 3. Сделанные для Китая процессоры, получившие названия HL-328 и HL-388, имеют форм-факторы OAM и PCIe соответственно: первый будет выпущен в июне, а второй — в сентябре, наряду с другим форм-фактором PCIe Gaudi 3.
В целом HL-328 и HL-388 выглядят более или менее так же, как и другие, с теми же 128 ГБ видеопамяти HBM2e с пропускной способностью 3.7 ТБ/с, 96 МБ кэш-памяти, интерфейсом PCIe 5.0 x16 и стандартами декодирования.
Единственная разница заключается в расчетной тепловой мощности, которая составляет 450 Вт как для моделей карт OAM, так и для карт PCIe. Это существенное снижение по сравнению с другими моделями. PCIe HL-338 не китайского производства имеет TDP 600 Вт, а форм-фактор OAM HL-325L и HL-335 — 900 Вт. Относительно низкий TDP китайских моделей Gaudi 3, по-видимому, является причиной отсутствия версии с жидкостным охлаждением.
Хотя это прямо не указано в техническом документе, внесение изменений почти наверняка было необходимо для соблюдения требований Экспортный контроль правительства США по процессорам, которые запрещают американским компаниям экспортировать чипы в Китай в зависимости от производительности.
Мы не можем точно знать, что Intel сделала с Gaudi 3, чтобы сделать его совместимым, и насколько быстро эти одобренные для Китая чипы работают с этими изменениями, но есть некоторые подсказки. В HL-328 и HL-388 по-прежнему используются два кристалла, как и в других вариантах Gaudi 3, поскольку конфигурация памяти и кэша не изменилась. Использование двух кристаллов вместо одного помогает снизить плотность производительности, позволяя чипу достичь более высокого экспортного предела в 4,800 общих вычислительных мощностей (TPP).
Ограничение в 4,800 TPP означает, что ни один чип не может иметь производительность 150 терафлопс или более при 16-битной обработке, а поскольку Gaudi 3 может обеспечить производительность до 1,835 терафлопс на BF16, Intel придется серьезно снизить производительность. Это должно быть достигнуто за счет действительно значительного сокращения количества ядер и тактовой частоты или какого-либо другого метода ограничения производительности.
Мы запросили у Intel разъяснения по поводу эксклюзивных для Китая моделей Gaudi 3, но пока не получили ответа. Мы сообщим, если Intel раскроет какую-либо информацию.
Вероятно, мы можем ожидать, что HL-328 и HL-388 будут работать аналогично Нвидиа Н20, самый быстрый графический процессор кремниевого титана, одобренный для продажи в Китае. Его производительность FB148 и FP16 составляет 16 терафлопс, что чуть ниже предела в 150 терафлопс.
Поскольку чистая производительность ядра будет более или менее одинаковой между H20 и китайской моделью Gaudi 3, основная разница будет сводиться к памяти, у которой у Intel больше мощности, но немного меньше пропускной способности, и программному обеспечению, которое всегда было преимуществом. для чипов Nvidia. ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2024/04/12/intel_paudi_3_china/