Программа «Биоинформатика для биологов» разработана для студентов и аспирантов биологических и медицинских специальностей.
Биоинформатика помогает биологам значительно ускорить профессиональный рост, а также решать интересные, сложные и нетривиальные научные задачи. Цель программы — отработка практических навыков программирования, статистического анализа, обработки данных NGS и визуализации результатов.
Программа обучения:
- Программирование на Python
Переменные и операции, ввод-вывод, коллекции, функции и исключения, классы и типы, модули, virtualenv, pip, pipenv, библиотеки pandas/numpy/biopython, Git / GitHub, регулярные выражения, базовые алгоритмы, работа с исключениями, тестирование/логирование, debugging, работа с удаленными ресурсами и базами данных, сборка геномов: граф Де брюйна, структуры данных. - Работа в командной строке
ssh, awk, grep, построение пайпов, zcat, sed, базовая работа с геномными утилитами bwa, samtools, bedtools - Дискретная математика
Базовые понятия теории множеств, булевы функции и логические высказывания, комбинаторика, асимптотический анализ алгоритмов, алгоритмы сортировки, динамическое программирование, теория графов и алгоритмы на графах - Статистика и анализ данных в R
Правила постановки эксперимента, формулирование гипотез, методы создания выборок, основные распределения данных, корреляция, линейные модели, логистическая регрессия, Байесовская статистика, создание пользовательских функций в R, глобальное и локальное окружение, встроенный git и Rroject, использование функций из пакетов, загрузка и установка пакетов (ggplot2, readxl, dplyr), сабсетинг данных, функции семейства apply, пользовательские функции, создание отчетов в .Rmd - Практикум по биоинформатике
Выравнивание на референс и поиск SNP, сборка геномов de novo, аннотация геномов, филогенетика, РНК-секвенирование и дифференциальная экспрессия генов, метагеномика
- Анализ данных NGS
Сборка геномов de novo, анализ вариантов и медицинская генетика, работа с метагеномными данными, анализ ампликонных библиотек 16S рДНК, анализ данных RNA-Seq, позиционные методы NGS — ChIP-Seq, Hi-C - Введение в машинное обучение
pandas, numpy, логические методы, методы подбора оптимальных гиперпараметров модели, основы кластеризации, Decision Trees, Random forest, градиентный бустинг, сверточные нейронные сети - Молекулярная эволюция и филогенетика
Выравнивание нуклеотидных и белковых последовательностей, генетика популяций, дрейф генов, геномный анализ популяционной структуры, методы оценки давления отбора на последовательности генов и геномов, анализ демографической истории популяций, геномные тренды в эволюции - Журнальный клуб
Геномы раковых опухолей, RNA seq и экспрессия генов, метагеномика, белковый дизайн, нейронауки, синтетическая биология - Научный проект
Работа над реальными биоинформатическими задачами под руководством научных сотрудников университетов всего мира
В программу могут быть внесены изменения. Предметы и подробная программа курсов объявляется перед началом учебного года.
Поступление на программу возможно выпускникам и специалистам с отличающейся базовой подготовкой при демонстрации необходимого уровня знаний и мотивации.