Cозданная нейросетью система CRISPR-Cas9 отредактировала геном человеческих клеток. Ее выложили в открытый доступ

Американские исследователи представили первый нейросетевой инструмент для создания полностью искусственных систем редактирования генома CRISPR-Cas9. Одну из них успешно испытали на человеческих клетках и выложили в открытый доступ, говорится в пресс-релизе компании Profluent.

Препринт публикации о создании инструмента, получившего название OpenCRISPR, доступен на ресурсе bioRxiv.org, коротко о нем рассказано на сайте проекта.

Создание систем редактирования генома на основе микробных CRISPR-связанных ферментов, таких как SpCas9, открыло новые перспективы в молекулярной биологии, медицине, сельском хозяйстве и биотехнологиях. Тем не менее природные бактериальные системы, оказываясь в неестественных для них условиях эукариотических клеток, обладают значимыми функциональными недостатками — в первую очередь недостаточной эффективностью редактирования, действием вне заданной мишени и невысокой стабильностью. Это заставляет искать новые варианты системы CRISPR-Cas в микроорганизмах или оптимизировать имеющиеся для практического применения, а это долгий и трудозатратный процесс.

Чтобы упростить его, Али Мадани (Ali Madani) с коллегами из компании Profluent задействовали большую языковую модель (LLM) ProGen2, созданную ими ранее для нейросетевого дизайна белковых молекул. Для этого они провели систематический сбор данных среди 26,2 триллиона пар оснований собранных микробных геномов и метагеномов из разных родов и биомов. Это позволило выявить почти миллион с четвертью оперонов CRISPR-Cas разных типов (самый большой их датасет в настоящее время, названный CRISPR-Cas Atlas), включающих эндонуклеазы Cas, последовательности CRISPR, транс-активирующие CRISPR-РНК (tracrРНК) и прилежащие к протоспейсеру мотивы (PAM).

После этого языковую модель на основе ProGen2 настроили на работу с CRISPR-Cas Atlas и с ее помощью сгенерировали четыре миллиона последовательностей, сбалансированных по семействам белков и размеру кластеров (на это ушло три дня с использованием 16 графических процессоров). Их распределили по типам CRISPR-Cas и отсеяли заведомо нефункциональные варианты с помощью инструментов BLAST и HMM.

Сопоставление с природными CRISPR-Cas с помощью MMseqs2 показало, что сгенерированные последовательности расширили разнообразие в 4,8 раза. Большинство этих последовательностей совпадали с ближайшей природной лишь на 40–60 процентов, однако их конформация, рассчитанная AlphaFold2, оказалась близкой, что свидетельствовало о потенциальной функциональности. Дальнейшие эксперименты с избранным количеством последовательностей и более точными инструкциями для модели позволили получить разнообразные полноценные эффекторы CRISPR-Cas II типа с совместимыми гидовыми РНК (гРНК).

Подробнее
Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

N+1