«Generative AI creates synthetic regulatory DNA sequences for precision gene control»
Опубликована 23 декабря 2025 г. - суть исследования и основных выводов:
Генеративный ИИ для проектирования регуляторной ДНК
В журнале Nature Genetics опубликовано исследование, посвящённое применению генеративного искусственного интеллекта для создания синтетических регуляторных последовательностей ДНК. Авторы работы представили модель под названием DNA-Diffusion, способную проектировать участки генома, отвечающие за контроль экспрессии генов в конкретных типах клеток.
Регуляторные элементы ДНК - такие как энхансеры и промоторы , не кодируют белки напрямую, однако играют ключевую роль в управлении активностью генов. Именно они определяют, где, когда и с какой интенсивностью ген будет работать. Из-за высокой сложности и контекстной зависимости этих последовательностей их рациональное проектирование долгое время оставалось одной из самых трудных задач молекулярной биологии.
Разработанная исследователями модель основана на диффузионных генеративных алгоритмах , подходе, который ранее получил широкое распространение в генерации изображений и текста. Модель обучалась на больших массивах данных о доступности хроматина и активности регуляторных участков в различных типах клеток человека и животных. В результате DNA-Diffusion научилась создавать новые последовательности ДНК длиной около 200 нуклеотидов с заданными регуляторными свойствами.
В отличие от традиционных методов, основанных на модификации уже известных природных элементов, ИИ-модель генерирует полностью новые последовательности, которые ранее не встречались в геноме. При этом они демонстрируют предсказуемую и воспроизводимую активность в заданных клеточных контекстах. Компьютерные оценки и экспериментальные тесты показали, что многие синтетические регуляторы не уступают природным аналогам, а в ряде случаев превосходят их по специфичности и силе действия.
Одним из примеров практического применения стало управление экспрессией гена AXIN2, участвующего в сигнальных путях, связанных с развитием клеток крови. Синтетический регулятор, созданный с помощью DNA-Diffusion, обеспечил более точное включение гена в целевых клетках, что указывает на потенциальную применимость подхода в генной терапии и клеточной инженерии.
Авторы подчёркивают, что предложенный метод не заменяет классические экспериментальные исследования, но существенно расширяет инструментарий биологов. Генеративный ИИ позволяет перейти от поиска и подбора существующих регуляторных элементов к их целенаправленному проектированию под конкретные задачи. Это может ускорить разработку генотерапевтических конструкций, синтетических биологических систем и инструментов точного контроля экспрессии генов.
Исследование демонстрирует, что подходы, ранее ассоциировавшиеся преимущественно с обработкой текста и изображений, могут быть эффективно адаптированы для работы с биологической информацией. По сути, ДНК рассматривается как язык со своей грамматикой и статистикой, которую способен освоить алгоритм машинного обучения. Это открывает новые перспективы для взаимодействия между вычислительными науками и молекулярной биологией.