Серверы NVIDIA Blackwell столкнулись с перегревом и сбоями

Крупные клиенты сокращают заказыСерверы NVIDIA Blackwell, разработанные для работы с искусственным интеллектом (ИИ), столкнулись с серьезными проблемами: перегревом и сбоями в работе. Эти недостатки привели к тому, что такие гиганты, как Microsoft, Google, начали сокращать свои заказы. Общая стоимость ранее запланированных закупок превышала $10 миллиардов.

© Ferra.ru

Проблемы начались еще в конце 2024 года, когда NVIDIA должна была запустить массовое производство серверов Blackwell. Сообщалось, что новая архитектура имела конструктивный дефект, из-за которого наблюдались повышенные тепловые нагрузки. Несмотря на заверения компании о решении проблемы, свежий отчет от The Information указывает на то, что серверы по-прежнему испытывают сбои, связанные с неправильным соединением чипов.

Ключевой проблемой, по данным экспертов, является технология упаковки CoWoS от TSMC, используемая для соединения компонентов. NVIDIA попыталась внести изменения в производство, заменив маску GPU, но это не принесло желаемого результата. На фоне этих сложностей крупные заказчики начали переключаться на предыдущую, проверенную временем линейку Hopper.

Источник

Like this post? Please share to your friends:
Alisa GPT
Добавить комментарий