В журнале Cell вышло исследование, описывающее, что генеративный ИИ смог успешно разработать исусственные молекулы, способные контролировать экспрессию генов в здоровых клетках млекопитающих. Ученые из Центра геномного регулирования (Испания) создали ИИ-инструмент, генерирующий ранее невиданные в природе ДНК-регуляторные последовательности. Модель может создавать фрагменты ДНК с заданными критериями. Например, включить в стволовых клетках ген, чтобы те превратились в эритроциты, но не в тромбоциты.Модель предсказывает комбинации «букв» ДНК (нуклеотидных оснований: A, T, C, G), необходимые для требуемых схем экспрессии генов в конкретных типах клеток. Ученые синтезировали примерно 250-буквенные фрагменты ДНК химическим путем и добавлили их в вирус для доставки в клетки.Исследователи попросили ИИ спроектировать синтетические фрагменты, активирующие ген, кодирующий флуоресцентный белок в некоторых клетках, не изменяя экспрессию генов. Фрагменты были созданы с нуля и внедрены в клетки крови мышей, где последовательности слились с геномом в случайных местах. Эксперименты прошли успешно, и дали предсказанный эффект.
«Потенциальные возможности для использования огромны. Это как писать программное обеспечение, только для биологии, давая новые способы управления развитием и поведением клеток с беспрецедентной точностью», — говорит доктор Роберт Фромель, первый автор исследования.
Открытие может привести к созданию новых методов повышения или снижения активности генов только в тех клетках или тканях, где это необходимо. Также оно может позволить настраивать гены пациента, делая лечение более эффективным и снижая побочные эффекты.
Многие заболевания связаны с нарушениями экспрессии генов, специфичными для разных клеток, для которых может никогда не существовать идеальных белковых препаратов. Экспрессия генов контролируется регуляторными элементами. Среди них энхансеры — небольшие фрагменты ДНК, которые включают или выключают гены. Чтобы исправить сбой экспрессии генов, ученые обычно ищут уже существующие в природе подходящие энхансеры.ИИ может сгенерировать энхансеры, которые природа еще не изобрела, с нужными для конкретных типов клеток свойствами. Уровень настройки может быть столь тонким, чтобы избежать побочных эффектов на здоровые клетки. Однако разработка ИИ-моделей требует большого количества высококачественных данных.
«Чтобы создать языковую модель для биологии, необходимо понять язык, на котором говорят клетки. Нужно было расшифровать грамматические правила энхансеров, чтобы создать совершенно новые слова и предложения», — объясняет доктор Ларс Вельтен, соавтор исследования.
Авторы создали огромные объемы биологических данных для построения своей ИИ-модели, проводя тысячи экспериментов на моделях образования крови. Они изучили как энхансеры, так факторы транскрипции — белки, также участвующие в экспрессии генов. Исследователи работали со здоровыми клетками, и эта работа помогла раскрыть тонкие механизмы, которые формируют нашу иммунную систему и выработку клеток крови.
На протяжении пяти лет команда синтезировала более 64 тысяч синтетических энхансеров. Это самая большая библиотека синтетических энхансеров в клетках крови на сегодняшний день. После внедрения в клетки ученые отслеживали, как каждый искусственный энхансер работал на протяжении семи стадий развития клеток крови. Они обнаружили, что многие энхансеры, когда активируют гены в одном типе клеток, подавляют их в другом.
Большинство энхансеров работали как регулятор громкости, увеличивая или уменьшая активность гена. Удивительно, но определенные комбинации работали как переключатели. Ученые назвали это «отрицательной синергией», то есть когда два фактора, которые обычно включают ген по отдельности, могут эффективно его выключать, когда они встречаются вместе.
Данные экспериментов были критически важны для определения принципов проектирования модели машинного обучения. Когда модель получила достаточное количество измерений, как каждый синтетический энхансер менял активность генов в реальных клетках, она смогла предсказать новые конструкции, дающие on/off результаты, даже если эти энхансеры никогда не существовали в природе.