Российские ученые выдвинули гипотезу о выделенности генетического алфавита с 4 нуклеотидами

Группа физиков из ФИАН, МФТИ и МГУ разработала новый метод сравнения двух молекул РНК, основанный на математическом сходстве метода динамического программирования и теории, описывающей образование комплекса двух полимерных цепей со сложной архитектурой. Этот метод может помочь предсказывать «оптимальную» вторичную структуру молекулы РНК по последовательности образующих ее нуклеотидов. Неожиданным следствием разработанного подхода (для простейшей модели РНК) стала гипотеза о статистическом механизме выделенности используемого природой числа нуклеотидов, 4.

Для эволюционной биологии вопрос сравнения ДНК и РНК последовательностей – один из ключевых, в частности, он позволяет судить о том, насколько далеко в эволюционном смысле разошлись друг от друга два рассматриваемых гена, и какие гены могут являться их общими предками.

И если вопрос сравнения двух последовательностей молекул дезоксирибонуклеиновой кислоты (ДНК) с алгоритмической точки зрения не вызывает принципиальных трудностей, то задача построения алгоритма сравнения молекул рибонуклеиновой кислоты (РНК) наталкивается на серьезные препятствия и несмотря на значительный прогресс в этой области, до сих пор полностью не решена.

Дело в том, что молекулы РНК содержат нетривиальную вторичную структуру типа «клеверного листа» или «кактуса». Образование этой вторичной структуры обусловлено наличием слабых водородных связей между удаленными по цепи комплиментарными нуклеотидами. Сергей Нечаев (ФИАН), Михаил Тамм (МГУ) и Ольга Вальба (МФТИ) предлагают метод сравнения РНК, явно учитывающий как порядок следования нуклеотидов, так и комбинаторику, обусловленную тем, что при заданной первичной структуре молекула РНК может образовать разные вторичные кактусоподобные структуры.

«Молекулы ДНК и РНК – это нерегулярные последовательности, образованные четырьмя типами "букв» – нуклеотидов. Задача сравнения или, как говорят, «выравнивания» последовательностей молекул ДНК, заключается в нахождении максимальной общей подпоследовательности двух молекул. Эта подпоследовательность не обязательно состоит из идущих непосредственно друг за другом букв, они могут идти и с пробелами – делециями. Задачу о сравнении двух последовательностей РНК мы свели к задаче о вычислении свободной энергии комплекса двух взаимодействующих неоднородных (гетерополимерных) цепей, каждая из которых может образовывать кактусоподобную структуру. Мы показали, что с формально-математической точки зрения известный рекурсивный алгоритм выравнивания последовательностей ДНК – так называемый, метод динамического программирования Смита-Ватермана – может рассматриваться как предел нулевой температуры в статистической модели связывания двух полимерных цепочек с произвольной первичной структурой. Обобщить это наблюдение на случай молекул РНК было уже делом техники", – рассказывает руководитель работы, доктор физ.-мат.наук Сергей Нечаев.

При сравнении молекул РНК, помимо непосредственной энергии связи контактов, необходимо учитывать комбинаторную энтропию образования разных вторичных структур. Таким образом,

поиск максимальной общей подпоследовательности сводится к вычислению минимальной свободной энергии комплекса двух молекул: чем меньше ее значение, тем более похожи две сравниваемые молекулы РНК.

Разработанный статистический алгоритм можно использовать и для решения обратной задачи – восстановления оптимальной структуры каждой из взаимодействующих молекул РНК по известной последовательности нуклеотидов конкретной молекулы РНК.

«Представьте себе, – поясняет Нечаев, – что в эксперименте возникла необходимость предсказать вторичную структуру синтезированной молекулы РНК по последовательности нуклеотидов. Наш алгоритм позволяет предсказать оптимальную с точки зрения статистической физики вторичную структуру молекулы РНК, которая будет соответствовать минимуму свободной энергии. При этом мы старались по возможности оставаться в рамках статистической физики и избегать эвристических соображений, полученных лишь на основе анализа экспериментальных данных».

finf_news1162.gif Рис. 1. Кактусообразная структура РНК (а) и ее «арочная» диаграмма (b).

Следствием разработанного подхода стало довольно неожиданное наблюдение. Оказалось, что если не ограничиваться только четырьмя типами нуклеотидов (аденин, цитозин, гуанин и урацил), присутствующими в простейшей модели РНК со случайной первичной структурой, а рассмотреть «алфавит» с произвольным числом «букв», с, то «выравнивание» молекул РНК при с ≤ 4 и при с > 4 происходит по-разному.

«Алфавит, который использует природа, – говорит Сергей Нечаев, – выделен тем, что при числе букв, меньшем или равном четырем, укладка очень длинной молекулы РНК практически не содержит пропусков, то есть их доля стремится к нулю, и каждому нуклеотиду найдется комплиментарный. В случае же, когда число букв больше четырех, в очень длинной цепи РНК всегда присутствует большое количество пропусков (их число сравнимо с длиной всей цепочки). Число "четыре» является пограничным: это максимальное число букв, при котором очень длинная случайная РНК может образовывать «совершенную» вторичную структуру, то есть у каждого нуклеотида в последовательности найдется комплиментарный".

Вопрос о том, почему природа использует именно 4 типа нуклеотидов, – один из важнейших в биологии и генной инженерии. Как предполагают исследователи из ФИАН, МГУ и МФТИ, с точки зрения статистической физики случайных гетерополимеров со сложной иерархической вторичной структурой типа РНК, число «четыре» (аденозин, цитидин, гуанозин и уридин) является статистически выделенным среди всех возможных алфавитов при изучении проблемы выравнивания. Для «линейной» молекулы ДНК, где количество нуклеотидов также равно четырем (аденозин, цитидин, гуанозин и тимидин), оно уже ничем не выделено. Это наблюдение может рассматриваться как косвенный аргумент в пользу гипотезы «РНК-мира», согласно которой на начальном этапе возникновение жизни на Земли существовали только РНК, а ДНК появились уже в результате их эволюции.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (6 votes)
Источник(и):

1. АНИ ФИАН Информ