Материалы летней школы по биоинформатике

Этим летом в Москве прошла первая летняя школа по биоинформатике. В ней приняло участие более 100 человек, которые приехали из различных уголков России и СНГ и были разделены на два потока: «информатики» и «биологи». Организовал мероприятие Институт биоинформатики в сотрудничестве с СПбАУ РАН, МГУ, ИППИ РАН и программой GameChangers.

Про то, как прошла сама школа, на хабре уже писали наши студенты. Теперь же каждый желающий, не имевший возможности поучаствовать в школе, может ознакомиться с интересующими его докладами: мы выложили все видеозаписи лекций и все слайды презентаций онлайн.

Если вы впервые слышите про биоинформатику, то советую в первую очередь посмотреть вводную лекцию Аллы Лапидус, которая расставит всё на свои места. Сейчас Алла занимает ведущие позиции в центре геномной биоинформатики СПбГУ и в лаборатории алгоритмической биологии СПбАУ РАН, а ранее долгое время руководила геномными проектами в DOE Joint Genome Institute (Калифорния).

bioinforatic.jpg

Под катом можно посмотреть список всех прошедших лекций, включая их краткие описания, которые помогут вам сориентироваться, а также полные видеозаписи на русском.

И в самом начале этого списка хочется сказать огромное спасибо Кириллу Григорьеву, который безвозмездно снимал и обрабатывал всё видео со школы, Ярославу Баранову и Павлу Яковлеву, которые помогали в съемках, а также yasha_somov за помощь с оборудованием.

Первый день школы прошёл на биофаке МГУ и состоял из достаточно сложных лекций, в которых ведущие учёные рассказали о последних трендах в биоинформатике:

1. Биоинформатические подходы к изучению микроэволюции. Алексей Кондрашов (University of Michigan, МГУ)

Победитель программы мегагрантов, руководитель лаборатории эволюционной геномики ФББ МГУ, Алексей Кондрашов, рассказал о том, что такое микроэволюция и популяция, какими характеристиками они обладают, какие задачи стоят в изучении микроэволюции и роль в этом процессе биоинформатики. Были рассмотрены такие темы, как: изменчивость популяций, мутационный процесс, дрейф, отрицательный, положительный и балансирующий отбор, размножение, географическая структурированность популяций. [ слайды ]

2. Генетическое репрограммирование соматических клеток: что нам дает биоинформатика. Сергей Киселёв (ИОГен РАН)

Во второй лекции было рассказано об огромном потенциале стволовых клеток и, в частности, индуцированных плюрипотентных стволовых клеток (ИПСК) для развития новейших методов клеточной терапии, создания модельных систем с целью изучения механизмов заболеваний и разработки лекарственных препаратов. В лекции обсуждались свойства и функциональные маркеры репрограммирования ИПСК, а также рассказывалось, как с помощью изменений в метилировании ДНК, модификации и транскрипции гистонов в сочетании с биоинформатическими методами создавать специфические маркеры, которые различают стволовые клетки и определяют их судьбу. [ слайды ]

3. Чтение человеческого генома как инструмент улучшения некоторых антропологических и исторических гипотез. Егор Прохорчук (Центр «Биоинженерия» РАН)

Далее было рассказано о применении методов биоинформатики в антропологии, а также освещена проблема этичности в сфере генетических исследований. Помимо этого, была затронута такая неожиданная и интересная тема, как сопоставление генетических и лингвистических данных. [ слайды ]

4. Молекулярные особенности эволюции мозга человека. Филипп Хайтович (Shanghai Institutes for Biological Sciences)

Филипп рассказал про фенотип, генотип и процесс перехода от фенотипа к генотипу; развитие человеческого мозга: транскриптом мозга, специфическую экспрессию генов различных видов и её отличия, особенности и механизмы в организме человека; исследование экспрессии генов людей, страдающих аутизмом; сравнение неандертальцев и современных людей. [ слайды ]

Начиная со второго дня, школа проходила в Подмосковье. Лекции начались с наиболее простых для понимания, с постепенным повышением сложности к концу школы:

5. Биоинформатика и её применения. Алла Лапидус (Центр геномной биоинформатики СПбГУ, СПбАУ РАН)

Была рассказана история дисциплины и различные трактовки понятия «биоинформатика», а также об основных областях применения биоинформатики, включая вопросы использования биоинформатики в медицине. [ слайды ]

6. Молекулярная биология для информатиков. Наталья Володина (СПбАУ РАН)

В нескольких лекциях было дано введение в молекулярную биологию для слушателей небиологических специальностей, включающее такие темы, как: структура и функции ДНК и РНК, центральная догма молекулярной биологии (ДНК → РНК → белок), структура белков и их функции, основные компоненты клетки и их функции. [ слайды 1 + [ слайды 2 ]

7. Разработка научного ПО: лучшие практики и подходы. Константин Оконечников (Max Planck Institute for Infection Biology, Berlin)

Было рассказано о рекомендованных методиках и способах разработки научного ПО. Многие из этих способов давно известны и успешно применяются в сфере разработки программного обеспечения, но требуют адаптации под «научную среду». Отдельное внимание в лекции уделено технологиям оптимизации производительности программных комплексов. [ слайды ]

8. Простые способы анализа сложных данных. Филипп Хайтович (Shanghai Institutes for Biological Sciences)

Во второй лекции Филипп рассказал более подробно о сфере своей научной деятельности, включая изучение специфичной для человека РНК по сравнению с другими млекопитающими, такими как шимпанзе и мышами; процессы старении мозга; длинные некодирующие РНК. [ слайды ]

9. Анализ данных NGS. Андрей Пржибельский (СПбАУ РАН)

Было рассказано об истории секвенирования, дан обзор популярных и развивающихся сегодня технологий, описаны их особенности и области применения. В лекции подробно обсуждается процесс и существующие программы для сборки генома, а также дается ответ на вопрос, существует ли единственный лучший ассемблер. [ слайды ]

Посты Андрея andrewprzh на эту тему на хабре: Биоинформатика: взгляд изнутри и Снова о биоинформатике: сборка бактериальных геномов .

10. Введение в чтение РНК. Константин Оконечников (Max Planck Institute for Infection Biology, Berlin)

Было рассказано о технологиях секвенирования транскриптома и техниках анализа данных, специфичных для данного типа эксперимента, включая методы выравнивания коротких ридов с учетом сплайсинга, сборку транскриптов, способы реконструкции изоформ, сравнительный анализ экспрессии генов, а также методы поиска деформаций в геноме и генов слияния (fusion genes). [ слайды ]

11. Графы де Брюйна и алгоритмы сборки. Сергей Нурк (СПбАУ РАН)

Было рассказано о постановке задачи сборки генома и использование для ее решения графов де Брюйна. В лекции также обсуждаются различные проблемы, связанные с ошибками секвенирования или нехваткой ресурсов. [ слайды ]

12. Биоинформатика в лаборатории: осмысление данных секвенирования следующего поколения. Константин Оконечников (Max Planck Institute for Infection Biology, Berlin)

Было рассказано о различных компьютерных программах, позволяющих анализировать данные Next Generation Sequencing (NGS), и о принципах, позволяющих их эффективно комбинировать и использовать. [ слайды ]

13. Приложения и базы данных секвенирования. Алла Лапидус (Центр геномной биоинформатики СПбГУ, СПбАУ РАН)

Во второй своей лекции, Алла рассказала об истории развития технологий секвенирования и разнообразии существующих биологических баз данных, которое диктуется многообразием стоящих задач и растущим приложением этих технологий в настоящее время (например, в персонифицированной медицине). [ слайды ]

14. Инвестиции в биотех: очевидные и неочевидные истории. Андрей Афанасьев (iBinom, МГУ)

В этой лекции было рассказано о нескольких биотехнологических проектах глазами инноваторов и инвесторов, а также был подробно представлен личный опыт спикера, являющегося основателем биоинформатического стартапа iBinom, по взаимодействию с венчурными фондами и институтами развития. [ слайды ]

15. Сборка и аннотация больших геномов. Павел Добрынин (Центр геномной биоинформатики СПбГУ)

Было рассказано о библиотеках для секвенирования и ресеквенирования, сборке хромосом, использовании референсных геномов близкородственных видов и о различных аспектах аннотирования генов. [ слайды ]

16. Медицинская биоинформатика: настоящее и тенденции. Александр Павлов, Антон Брагин (Sequoia Genetics)

Было рассказано об основных приложениях биоинформатики в медицине и перспективных направлениях ее развития; о геномной медицине, задачах и требованиях к качеству клинических данных, подходам к их получению и трансляции. Вторая часть лекции посвящена техническим аспектам создания ПО, предназначенного для клинической интерпретации биоинформатических данных (принципиальные способы построения pipeline'ов анализа, модульная организация, существующие фреймфорки и сервисы, специфические для биомедицинского ПО, особенности дизайна). [ слайды ]

17. Миниконференция (презентации студентов)

Миниконференция проходила в формате презентаций участников летней школы, которые модерировал Михаил Райко (СПбГУ, СПбАУ РАН). На стадии конкурсного отбора была возможность подать тезисы, и отобранные 13 человек рассказали о своих исследованиях в формате пятнадцатиминутных докладов. С подробными темами и слайдами докладчиков можно ознакомиться на сайте .

18. Анализ данных NGS. Андрей Пржибельский (СПбАУ РАН)

В рамках данного семинара для информатиков подробно рассказано об эффективных алгоритмах и методах для анализа данных NGS. Во второй части семинара к Андрею Пржибельскому подключился Антон Коробейников, также из лаборатории алгоритмической биологии СПбАУ РАН.

19. Обзор биотехнологий. Александр Карабельский (BIOCAD)

Было рассказано о современных направлениях исследований в сфере моноклональных антител, описаны их виды, свойства и спектр применения, а также подробно разобран процесс разработки с рассмотрением его стадий и используемых методов (на примере биотехнологической компании BIOCAD). [ слайды ]

20. Биоинформатика ДНК-белкового взаимодействия и регуляции генов. Всеволод Макеев (ИОГен РАН, МФТИ)

Было рассказано о том, чем отличаются последовательности ДНК разных видов, почему сходные гены работают по разному и почему конкретные гены работают в конкретный момент времени (в конкретной ткани). Освещены такие вопросы, как синтез РНК и последующие стадии, тканеспецифичная экспрессия, регуляция и регуляторы транскрипции, а также представлен обзор различных методов и технологий изучения ДНК-белкового взаимодействия и регуляции генов и сравнение существующих программ. [ слайды ]

21. E-value в BLAST. Антон Коробейников (СПбАУ РАН, СПбГУ)

В двух лекциях, наполненных математикой, было рассказано о статистических принципах и результатах, позволяющих оценить значимость совпадений между строками и отличить действительно неслучайные совпадения от случайных (для биоинформатика BLAST — это стандартное средство для поиска схожести между последовательностями белков и нуклеотидов, самая цитируемая научная статья 90-х годов). Предполагается, что слушатель лекции знаком с основными понятиями статистики и теории вероятностей (распределение, случайная величина, среднее, оценка, статистическая гипотеза).

22. Биотехнологии для биологов. Александр Карабельский (BIOCAD)

В своей второй лекции, Александр рассказал на примере компании BIOCAD о структуре и организации работы современных фармацевтических компаний, типах и свойствах лекарственных препаратов для лечения онкологических и аутоиммунных заболеваний, иммуноглобулинах и причинах их разнообразия, использовании антител и их свойств в терапии, а также других смежных темах. [ слайды ]

23. Мои первые 100 проектов на IonTorrent: рассказ биоинформатика. Дмитрий Алексеев (НИИ ФХМ)

Было рассказано о практическом опыте и результатах использования оборудования IonTorrent для различных целей: чтение и сборка генома, ресиквенс, библиотеки парных ридов, метагеномика, 16S анализ и другие. [ слайды ]

24. Writing for Scientists. Наталья Кузнецова (ИБХ РАН)

Было рассказано о правилах и методиках написания научных статей на английском языке, правильном использовании лексики, пунктуации, структуре текста и типичных ошибках. [ слайды ]

25. Динамика синтетических сетей генной регуляции. Михаил Иванченко (ННГУ)

В этой лекции было рассказано о построении искусственных регуляторных сетей с заданным поведением, например флуоресцентно осциллирующих колоний бактерий, а также о необходимых для этого математических моделей и методах их исследования, важнейших теоретических и экспериментальных результатах, полученных в этой области, о ряде открытых актуальных задач. [ слайды ]

26. Динамика синтетических сетей генной регуляции. Алексей Заикин (University College London)

В следующей лекции Алексей, коллега Михаила, продолжил тему построения искусственных регуляторных сетей со сложной динамикой. [ слайды ]

27. Биоинформационная оценка совершенства стволовых клеток человека. Мария Шутова (ИОГен РАН)

В этом научном докладе Мария, сотрудница лаборатории Сергея Киселёва (который прочитал в первый день лекцию о генетическом репрограммировании соматических клеток), рассказала о сравнении эмбриональных стволовых клеток (ЭСК) и индуцированных плюрипотентных стволовых клеток (ИПСК), имеющих различную генетическую природу и решении задачи доказательства их идентичности. В лекции было рассказано о создании изогенной системы, позволяющей провести сравнения экспрессии (Illumina HT12) и CpG метилирования (Illumina 450k) ЭСК, дифференцированных клеток и ИПСК. В рассказе освещены молекулярные и биоинформационные методы, использованные в анализе, а также озвучены предварительные результаты этого исследования. [ слайды ]

28. Использование карт в сборке геномов. Алексей Макунин (Центр геномной биоинформатики СПбГУ)

Несмотря на то, что последняя лекция школы состоялась в 10 утра в субботу (после пятничного прощального вечера), почти все участники школы смогли её посетить, и Алексей рассказал о различных способах картирования геномов – от использования BAC-клонов до метода радиационных гибридов и сборки с использованием близкородственных референсных геномов, в том числе об определении порядка скэффолдов, что является важным шагом для сборки и финиширования геномов. [ слайды ]

В заключение

Учитывая большой интерес к школе и положительные отзывы участников, мы решили проводить её ежегодно. Летом 2014-ого школа пройдёт в Питере. Кроме того, если вас заинтересовала тема, то записывайтесь на начинающийся онлайн курс по алгоритмам в биоинформатике на Coursera (хабрапост о курсе) .

Отдельно хочу поблагодарить команду организаторов школы – Катю Чайкину и Аню Черныш, – без которых школа бы не состоялась, а также всех помогавших нам друзей и волонтёров. Ну и, конечно, наших добрых спонсоров, в особенности широко известную компанию JetBrains за стабильную поддержку Института биоинформатики в течение последних трёх лет.

Красивый отчёт об итогах школы можно прочитать тут (осторожно, PDF на 6.5 MB) .

Институт биоинформатики: сайт, твиттер, вконтакте, летняя школа по биоинформатике 2014 .

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (1 vote)
Источник(и):

habrahabr.ru