Библиотека в пробирке: новый метод кодирования данных на ДНК

Блог компании ua-hosting.company. В контексте возраста планеты Земля человечество как вид существует не так давно. Однако за это время мы успели пройти невероятный эволюционный путь, в ходе которого нам открывались все новые и новые знания. С открытием письменности мы получили возможность фиксировать ту или иную информацию, дабы она была доступна другим спустя время.

Технологический прогресс привел к цифровизации мира и формированию информационной сферы Земли, которая по некоторым оценкам насчитывает порядка 64 зеттабайт данных, т. е. Около 7 ×1013 Гб. Вполне ожидаемо, что вопрос хранения постоянно растущего объема данных стоит для современного общества весьма остро. Потому поиски новых методов хранения и новых типов хранилищ крайне важен.

Ученые из Технического университета Эйндховена (Нидерланды) разработали новую методику хранения данных с помощью ДНК. В чем секрет данной методики, насколько работоспособны полученные хранилища, и сколько данных можно на них хранить? Ответы на эти вопросы мы найдем в докладе ученых.

Основа исследования

Проблема современного мира в аспекте информации заключается в том, что мы генерируем больше данных, чем можем хранить. Классические методы хранения (жесткие диски, магнитные ленты и т.д.) хоть и широко распространены, но обладают ограниченным сроком службы и, что важнее, ограниченной плотностью хранения. В связи с этим все больший интерес вызывают малые органические молекулы, полимеры и даже ДНК, как потенциальные хранилища данных.

Присущая ей способность к хранению информации, долговечность и высокая плотность информации делают ДНК главным кандидатом для хранения архивных цифровых данных. Заметный прогресс был достигнут в схемах кодирования, используемых для преобразования двоичных данных в ДНК, и лучший на сегодняшний день метод позволяет достичь плотности 17 экзабайт на грамм (около 1.8 х 1010 Гб), что примерно на шесть порядков превышает магнитные и оптические аналоги. Кроме того, длительное хранение ДНК в специальных оболочках из природных или синтетических материалов позволяет хранить данные намного дольше, чем это возможно в случае обычных магнитных носителей данных.

С появлением параллельного химического и ферментативного синтеза стало возможным крупномасштабное производство ДНК для хранения данных. В то же время секвенирование ДНК с использованием Illuminahttps://www.illumina.com/techniques/sequencing.html или метода на основе нанопор позволило достичь высокопроизводительного считывания последовательностей ДНК.

Обходя необходимость секвенировать целые наборы данных, закодированные в ДНК, произвольный доступ на основе полимеразной цепной реакции (ПЦР) может выборочно извлекать закодированные данные из сложного пула ДНК файлов. Однако у ПЦР есть два недостатка. Во-первых, небольшая часть пула безвозвратно расходуется во время амплификации данных и повторного копирования искаженной последовательности ДНК. Во-вторых, мультиплексный поиск файлов, закодированных ДНК, с использованием ПЦР затруднен из-за систематической ошибки ПЦР и образования артефактов из-за молекулярных перекрестных помех. Смещение ПЦР возникает из-за различий в длине, составе последовательности, содержании гуанина-цитозина и вторичной структуре ДНК.

Смягчить последствия образования артефактов и систематической ошибки можно путем тщательного проектирования последовательности и включения дополнительных физических и логических избыточностей, но это приводит к увеличению стоимости синтеза и секвенирования ДНК. Потому современные стратегии извлечения нескольких ДНК файлов основаны на физическом разделении реакций и индивидуальной амплификации каждого файла с использованием нескольких одиночных ПЦР реакций. Параллельная амплификация в одном реакционном сосуде может быть достигнута с помощью эмульсионной ПЦР, которая разделяет матрицы ДНК с помощью капель воды в масле и предотвращает образование артефактов. Хотя эмульсионная ПЦР использовалась для извлечения данных ДНК, сложный рабочий процесс, невозможность повторного использования и большое количество органических растворителей, необходимых для образования эмульсий для каждой реакции, делают ее малополезной для крупномасштабных систем.

dnk1.pngИзображение №1

В рассматриваемом нами сегодня труде ученые описывают метод, называемый «термоограниченной ПЦР», в котором используются микрореакторы с температурно-зависимой проницаемостью мембраны для повышения точности амплификации ПЦР.

Подробнее
Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (1 vote)
Источник(и):

Хабр