ИИ от MIT научился создавать молекулы по текстовому описанию

ИИ от MIT научился создавать молекулы по текстовому описанию Ученые из Массачусетского технологического института (MIT) и лаборатории MIT-IBM Watson разработали новую систему искусственного интеллекта (ИИ), способную создавать молекулы по обычному текстовому запросу. Метод получил название Llamole — от «Large Language Model for Molecular Discovery». Он сочетает языковые модели, как ChatGPT, с графовыми нейронными сетями, которые лучше справляются с химическими структурами.

ИИ от MIT научился создавать молекулы по текстовому описанию

Ученые из Массачусетского технологического института (MIT) и лаборатории MIT-IBM Watson разработали новую систему искусственного интеллекта (ИИ), способную создавать молекулы по обычному текстовому запросу. Метод получил название Llamole — от «Large Language Model for Molecular Discovery». Он сочетает языковые модели, как ChatGPT, с графовыми нейронными сетями, которые лучше справляются с химическими структурами.

Создание новых молекул — важный этап в разработке лекарств и материалов, но этот процесс требует больших затрат времени и вычислительных ресурсов. Языковые модели умеют обрабатывать текст, но плохо справляются с химией, поскольку молекулы представляют собой графы, а не последовательности слов. С другой стороны, специализированные графовые модели не понимают язык и требуют сложных входных данных.

Команда MIT объединила эти два подхода в единую систему. Llamole принимает на вход текстовый запрос, например: «молекула, проникающая через гематоэнцефалический барьер и подавляющая ВИЧ, с молекулярной массой 209». Затем система чередует работу языковой модели и графовых модулей, создавая молекулу, объясняя, как она устроена, и предлагая пошаговый план ее синтеза.

Особенность подхода — использование «триггерных токенов», с помощью которых LLM понимает, когда подключать нужный модуль. Выходы каждого модуля снова подаются в языковую модель, создавая замкнутый цикл, где все элементы системы понимают действия друг друга.

Эксперименты показали, что Llamole создает более качественные молекулы и улучшает точность планирования синтеза с 5% до 35%. При этом система работает эффективнее даже тех языковых моделей, которые в десять раз крупнее.