В прошлом году за ИИ-разработки впервые вручили Нобелевскую премию. Причем сразу две: по физике (за машинное обучение нейросетей) и химии. Премию в химии присудили за алгоритм AlphaFold, который предсказывает трехмерную структуру белков на основе их аминокислотной последовательности. Теперь то, что требовало от команд ученых многолетних исследований, может занимать десятки часов — и дальше этот тренд будет только ускоряться. О том, как искусственный интеллект становится драйвером научных открытий, о возможностях больших языковых моделей и ИИ-ученых, рассуждает старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев
Примеров применения ИИ для науки становится все больше. Система AlphaDev улучшает алгоритмическую сортировку. Робохимик Synbot автоматизирует синтез органических молекул. Инструмент GNoME помогает производить полупроводники для робототехники. Всего 17 дней понадобилось GNoME, чтобы получить 380 000 кандидатов стабильных кристаллов, — у человека на это ушло бы порядка 800 лет.
Мы все чаще видим, как большие языковые модели быстро совершенствуют свое понимание науки. Вышедшая в декабре модель ChatGPT o1 от OpenAI отвечает на вопросы и решает определенные научные задачи на уровне аспиранта. Модель «Сбера» GigaChat Max в 2024 году успешно сдала экзамен по лечебному делу. А недавно вышедшая и нашумевшая модель DeepSeek показала, что большие модели со способностью рассуждать можно делать гораздо меньшими ресурсами, чем до этого предполагалось.
Чтобы совершать новые открытия, ученым нужно освоить гигантский массив информации, который продолжает расти в геометрической прогрессии. При этом большинство ученых по-прежнему публикуют результаты своей работы в формате трудных для понимания англоязычных научных статей, насыщенных профессиональными терминами. Это не всегда способствует интересу общественности к их работе.
Искусственный интеллект меняет представления о том, что значит читать или писать научную статью, когда ее можно рецензировать, корректировать и преобразовывать в интерактивный формат или аудиогид для конкретной аудитории. Генерация, извлечение и анализ больших наборов научных данных тоже меняются кардинально.
Принято считать, что мы живем в эпоху изобилия данных, но при этом остается хронический дефицит научных данных о большинстве аспектов природы и жизни людей. ИИ может кардинально улучшить качество данных, снизив ошибки, например при секвенировании ДНК, определении типов клеток в образце или улавливании звуков животных.
Моделирование сложных систем и описание взаимодействия их компонентов — одна из сложнейших научных задач. Последние 50 лет ученые, опираясь на системы уравнений или иные детерминированные допущения, изо всех сил пытались охватить всю сложность систем в биологии, экономике, прогнозировании погоды и других областях. Сложности моделирования таких систем мешают предсказывать или контролировать их поведение, особенно при резком изменении условий или внешнем вмешательстве (например, когда повышается температура или вводится новое лекарство).
Нередко ИИ не столько заменяет традиционные подходы к моделированию сложных систем, сколько расширяет их. Так, агентное моделирование позволяет имитировать взаимодействие между отдельными субъектами, например компаниями и потребителями, чтобы понять, как эти взаимодействия влияют на гораздо более сложную систему — экономику. В традиционных подходах ученым необходимо заранее определить, как эти вычислительные агенты должны себя вести. Уже описано, как ученые могут использовать большие языковые модели для создания более гибких генеративных агентов, которые умеют общаться и выполнять действия, например искать информацию или делать покупки, обосновывая эти действия и запоминая их. Ученые могут использовать обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные, то есть обучение софта принятию решений для достижения наиболее оптимальных результатов), чтобы понять, каким образом эти агенты обучаются и адаптируют свое поведение в условиях более динамичного моделирования, например в ответ на новые цены на энергоресурсы или меры по борьбе с пандемией.
Но главное, чего мы ждем от ИИ, — это помощь в открытии инновационных решений для научных проблем с большим пространством поиска, недоступном классическим алгоритмам. Например, биологи и химики стремятся определить структуру, характеристики и функции молекул белков, чтобы разработать новые версии этих молекул и использовать их как лекарства на основе антител, энзимы, разрушающие пластик, или инновационные материалы. Но для создания низкомолекулярного лекарственного препарата ученые должны изучить более 1060 потенциальных вариантов молекул. Чтобы создать белок с 400 стандартными аминокислотами, нужно обработать 20 400 вариантов. Тут даже классическое сравнение с количеством атомов во Вселенной не может дать ощущения масштаба задачи.
Другие вызовы подобного рода — поиск математических доказательств, определение самого эффективного алгоритма для решения задачи в области информатики или построение оптимальной архитектуры компьютерного чипа. Обычно ученые решают такие задачи, сочетая интуицию, метод проб и ошибок, итерацию и вычисление методом грубой силы. Но эти методы не позволяют охватить все пространство возможных решений, в итоге оптимальные варианты остаются неисследованными. В то время как ИИ открывает доступ к новым областям пространства поиска и одновременно помогает быстрее находить действенные решения.
Очевидно, что в сегодняшней гонке технологий развитию науки будет способствовать искусственный интеллект, который станет полноценным членом исследовательской команды, а в перспективе — соавтором открытия, достойного Нобелевской премии. Важно, что мы уже находимся в фарватере этой гонки, создаем конкурентные языковые модели и новые инструменты на основе ИИ, способные кратно усилить возможности российских ученых и максимально помочь им ускорить научный прогресс.
Мнение редакции может не совпадать с точкой зрения автора
Источник: www.forbes.ru