IBM научилась тренировать нейросети со скоростью света: как это работает

IBM сделала шаг вперед в развитии технологий для центров обработки данных. Компания разработала метод использования света для передачи данных внутри вычислительных систем. Это открытие способно ускорить обучение генеративных моделей ИИ в пять раз и одновременно сократить энергопотребление по сравнению с традиционными технологиями.

Основная проблема современных вычислений — это ограничение, связанное с использованием медных проводников. Электроны, движущиеся по проводам, часто становятся узким местом, из-за чего процессоры вынуждены простаивать, ожидая данных. Это приводит к росту энергозатрат и замедлению вычислений.

IBM решила эту проблему, создав новую систему Co-Packaged Optics (CPO). Ее основа — оптические соединения, которые используют свет вместо электричества для передачи данных. Компания разработала и протестировала первый успешный прототип Polymer Optical Waveguide (PWG). Эта технология обеспечивает передачу данных с терабитной скоростью и минимизирует задержки.

IBM научилась тренировать нейросети со скоростью света: как это работает

Почему это важно

Оптические соединения уже давно используются для передачи данных на большие расстояния через оптоволокно. Однако IBM стала первой, кто перенес эту концепцию внутрь компьютеров. Преимущество PWG в том, что она соединяет компоненты системы, такие как процессоры и серверы, со скоростью света и устраняет ограничения медных кабелей.

Благодаря новой технологии, обучение крупной языковой модели, которое раньше занимало три месяца, теперь можно выполнить всего за три недели. Это стало возможным благодаря 80-кратному увеличению пропускной способности между компонентами.

Энергоэффективность и масштабируемость

Еще один важный аспект технологии IBM — ее экологическая устойчивость. Использование CPO снижает энергопотребление настолько, что позволяет сэкономить электричество, достаточное для питания 5000 домов в течение года при обучении одной модели ИИ.

Кроме того, новая технология увеличивает гибкость архитектуры дата-центров. Оптические соединения могут работать на расстоянии до сотен метров, что позволяет инженерам проектировать более масштабные и эффективные системы. Как отметил Дарио Гил, старший вице-президент IBM по исследованиям: «Эта технология станет основой будущих вычислительных систем, где скорость и устойчивость будут ключевыми факторами».

Разработка компании подтверждает лидерство в области инноваций. Однако не только IBM двигает прогресс. На этой неделе Google представила мощнейший чип для квантовых вычислений.

Источник: hi-tech.mail.ru

Like this post? Please share to your friends:
Alisa GPT
Добавить комментарий