Программы профессиональной переподготовки по биоинформатике


Начало набора на 2021/22 учебный год будет объявлено в декабре 2020 года.

Подпишитесь на новости Института, чтобы не пропустить открытие набора.
Образовательные программы направлены на изучение биологических процессов с помощью современных вычислительных технологий. При успешном завершении выдается диплом о профессиональной переподготовке.

Обучение проходит в Санкт-Петербурге по двум направлениям: «Биоинформатика для биологов» и «Алгоритмическая биоинформатика». Занятия по субботам и вечерам будних дней. Можно совмещать с учёбой в вузе, профессиональной или научной деятельностью. Длительность — один год, с сентября по сентябрь.
Формат
Год по субботам и 1–2 вечера в будни. Лекции, семинары, научные проекты, хакатон и стажировки.
Стоимость
Студентам всех курсов и аспирантам первого года очной формы бесплатно. Выпускникам — 20 000 рублей в семестр. После сессии на «отлично» — скидка 50%.
Сертификат
При успешном окончании выдается диплом о профессиональной переподготовке Института биоинформатики.
Путь абитуриента
1
Подать заявку
2
Решить онлайн-курс
3
Написать письменное тестирование
4
Пройти собеседование
О программах
БИОЛОГАМ
ИНФОРМАТИКАМ
Программа «Биоинформатика для биологов» разработана для студентов и аспирантов биологических и медицинских специальностей.

Биоинформатика помогает биологам значительно ускорить профессиональный рост, а также решать интересные, сложные и нетривиальные научные задачи. Цель программы — отработка практических навыков программирования, статистического анализа, обработки данных NGS и визуализации результатов.

Программа обучения:

  • Программирование на Python
    Переменные и операции, ввод-вывод, коллекции, функции и исключения, классы и типы, модули, virtualenv, pip, pipenv, библиотеки pandas/numpy/biopython, Git / GitHub, регулярные выражения, базовые алгоритмы, работа с исключениями, тестирование/логирование, debugging, работа с удаленными ресурсами и базами данных, сборка геномов: граф Де брюйна, структуры данных.
  • Работа в командной строке
    ssh, awk, grep, построение пайпов, zcat, sed, базовая работа с геномными утилитами bwa, samtools, bedtools
  • Дискретная математика
    Базовые понятия теории множеств, булевы функции и логические высказывания, комбинаторика, асимптотический анализ алгоритмов, алгоритмы сортировки, динамическое программирование, теория графов и алгоритмы на графах
  • Статистика и анализ данных в R
    Правила постановки эксперимента, формулирование гипотез, методы создания выборок, основные распределения данных, корреляция, линейные модели, логистическая регрессия, Байесовская статистика, создание пользовательских функций в R, глобальное и локальное окружение, встроенный git и Rroject, использование функций из пакетов, загрузка и установка пакетов (ggplot2, readxl, dplyr), сабсетинг данных, функции семейства apply, пользовательские функции, создание отчетов в .Rmd
  • Практикум по биоинформатике
    Выравнивание на референс и поиск SNP, сборка геномов de novo, аннотация геномов, филогенетика, РНК-секвенирование и дифференциальная экспрессия генов, метагеномика
  • Анализ данных NGS
    Сборка геномов de novo, анализ вариантов и медицинская генетика, работа с метагеномными данными, анализ ампликонных библиотек 16S рДНК, анализ данных RNA-Seq, позиционные методы NGS — ChIP-Seq, Hi-C
  • Введение в машинное обучение
    pandas, numpy, логические методы, методы подбора оптимальных гиперпараметров модели, основы кластеризации, Decision Trees, Random forest, градиентный бустинг, сверточные нейронные сети
  • Молекулярная эволюция и филогенетика
    Выравнивание нуклеотидных и белковых последовательностей, генетика популяций, дрейф генов, геномный анализ популяционной структуры, методы оценки давления отбора на последовательности генов и геномов, анализ демографической истории популяций, геномные тренды в эволюции
  • Журнальный клуб
    Геномы раковых опухолей, RNA seq и экспрессия генов, метагеномика, белковый дизайн, нейронауки, синтетическая биология
  • Научный проект
    Работа над реальными биоинформатическими задачами под руководством научных сотрудников университетов всего мира

В программу могут быть внесены изменения. Предметы и подробная программа курсов объявляется перед началом учебного года.

Поступление на программу возможно выпускникам и специалистам с отличающейся базовой подготовкой при демонстрации необходимого уровня знаний и мотивации.
Поступление
Отбор проводится на конкурсной основе в три этапа:

Заявка
Мы ждем мотивированные заявки, с описанием того, для чего вам важно обучение на программе. Приемная комиссия внимательно читает их перед собеседованиями и составляет по ним первое впечатление об абитуриенте.

Вступительный онлайн-курс
по основам программирования на Python, R и работе в Linux
Ссылка на курс придет автоматически в ответ на заполненную заявку. Учитывайте, что на прохождение курса требуется время. Если вы уже проходили онлайн-курсы «Программирование на Python», «Введение в Linux» и «Анализ данных в R», из модулей которых состоит вступительный курс, то эти баллы вам зачтутся автоматически. Записаться в участники вступительного курса необходимо в любом случае.

Письменное тестирование
Тестирование направлено на проверку знаний по основным темам: молекулярная биология и генетика, основы статистики, введение в программирование на Python и работа в командной строке. К тестированию допускаются только абитуриенты, успешно решившие вступительный курс на необходимое количество баллов.
Пример письменного тестирования

Собеседование
В случае успешной сдачи письменного теста абитуриент приглашается на устное общение с комиссией. Перед собеседованием абитуриент читает статью, аналогичную примеру, и готовит ответы на несколько вопросов по ней. Собеседование длится час: 30 минут на чтение статьи и 30 на общение с комиссией.
    Требования
    От вас ожидаются хорошо систематизированные знания генетики и клеточной биологии, молекулярных механизмов хранения, передачи и изменения наследственной информации, умение разбираться в принципах и методах генетической инженерии и биотехнологии в целом. Базовые знания программирования на Python и статистики после пройденного вступительного онлайн-курса.

    Обычно успешные кандидаты — это студенты старших курсов, магистранты и начинающие аспиранты. В процессе учебы вам понадобится читать научные статьи на английском языке. Поступление на программу возможно уже не студентам/аспирантам с отличающейся базовой подготовкой при демонстрации необходимого уровня знаний и мотивации.
    Подготовка
    Освежить знания рекомендуем с помощью:

    Онлайн-курсов «Mолекулярная биология и генетика», «Молекулярная биология клетки», «Генная инженерия».

    Литературы:
    Глик, Б. — Молекулярная биотехнология (2002);
    Щелкунов, С. — Генетическая инженерия (2004);
    Alberts, B. — Molecular biology of the cell (2008);
    Lodish, H. — Molecular Cell Biology (7th ed., 2012);
    Журавлева Г.А. — Генная инженерия в биотехнологии (2017).


    Глоссария для биологов Института биоинформатики.
    Программа «Алгоритмическая биоинформатика» разработана для студентов математических, информатических и прочих технических специальностей. Для информатиков и математиков биоинформатика — это возможность решать интересные и сложные алгоритмические задачи и применять свои знания для решения важнейших задач человечества, связанных со здоровьем, качеством и продолжительностью жизни людей и сделать реальный вклад в развитие наук о жизни.

    Программа обучения:

    • Статистика
      Понятие выборки, точечные оценки, интервальное оценивание, проверка статистических гипотез, сверхэффективные оценки, проверка статистических гипотез, общие подходы к построению статистических критериев, критерии согласия, непараметрические критерии
    • Молекулярная биология
      Типы клеточной организации, регуляция работы гена, мобильные элементы генома, транскрипция, эпигенетика, многообразие белковых молекул, сети белковых взаимодействий, клеточный метаболизм и сигнальные пути, математическая биология, генная инженерия
    • Алгоритмы в биоинформатике
      Центральная догма молекулярной биологии, алгоритмы попарного и множественного выравнивания, методы работы с вторичной структурой РНК, алгоритмы построения деревьев, HMM, сборка геномов
    • Практикум по биоинформатике
      Выравнивание на референс и поиск SNP, сборка геномов de novo, аннотация геномов, филогенетика, РНК-секвенирование и дифференциальная экспрессия генов, аннотация снипов у человека, метагеномика
    • Анализ данных NGS
      Выравнивание коротких ридов, выравнивание длинных ридов с высоким уровнем ошибки, исправление ошибок в ридах Illumina, сборка геномов de novo, оценка качества геномных сборок, метагеномика, данные RNA-Seq
    • Машинное обучение
      Instance-based learning, kNN, prototype selection, classification metrics, clustering, decision trees, ensembles, perceptron, logistic regression, deep learning for images, SVM, Bayes classifier, regression, reinforcement learning
    • Молекулярная эволюция и филогенетика
      Выравнивание нуклеотидных и белковых последовательностей, генетика популяций, дрейф генов, геномный анализ популяционной структуры, методы оценки давления отбора на последовательности генов и геномов, анализ демографической истории популяций, геномные тренды в эволюции
    • Журнальный клуб
      Геномы раковых опухолей, RNA seq и экспрессия генов, метагеномика, белковый дизайн, нейронауки, синтетическая биология
    • Научный проект
      Работа над реальными биоинформатическими задачами под руководством научных сотрудников университетов всего мира

    В программу могут быть внесены изменения. В зависимости от уровня группы статистика в первом семестре может быть заменена на теорию вероятности. Предметы и подробная программа курсов объявляется перед началом учебного года.

    Поступление на программу возможно выпускникам и специалистам с отличающейся базовой подготовкой при демонстрации необходимого уровня знаний и мотивации.
    Поступление
    Отбор проводится на конкурсной основе в три этапа:

    Заявка
    Мы ждем мотивированные заявки, с описанием того, для чего вам необходимо обучение на основной программе. Приемная комиссия внимательно читает их перед собеседованиями и составляет по ним первое впечатление об абитуриенте.

    Онлайн-курс и 15 задач на Rosalind Bioinformatics Stronghold
    Ссылка на эти задания придет в ответ на заполненную анкету. Если вы уже проходили онлайн-курсы: «Молекулярная биология и генетика», «Теория вероятностей» и «Математический анализ», а также решали задачи на Rosalind, то эти баллы вам зачтутся автоматически. Поступить на курс необходимо даже в случае прохождения этих курсов.

    Письменное тестирование
    Тестирование направлено на проверку знаний в основных требуемых темах: комбинаторика, алгоритмы, теория вероятностей, линейная алгебра. К тестированию допускаются только абитуриенты, успешно решившие вступительный курс на необходимое количество баллов.
    Пример письменного тестирования

    Собеседование
    В случае успешного прохождения тестирования мы пригласим вас на собеседование. Перед собеседованием абитуриент решает задачи, аналогичные некоторым задачам письменного тестирования. Собеседование длится час: 30 минут на чтение статьи и 30 на общение с комиссией. Во время общения происходит обсуждение задач, анализ общего уровня знаний по перечисленным в разделе «Требования» темам и обсуждение мотивации поступления в Институт.
    Требования
    Как правило, успешные кандидаты — это студенты старших курсов, магистранты и начинающие аспиранты. Поступление на программу возможно уже не студентам/аспирантам с отличающейся базовой подготовкой при демонстрации необходимого уровня знаний и мотивации.

    От кандидатов, поступающих на программу «Алгоритмическая биоинформатика», ожидается знание перечисленных ниже областей и тем.

    Комбинаторика:

    1. Основные правила комбинаторики. Правило подсчета количества комбинаторных объектов. Принцип Дирихле.
    2. Множества, операции на множествах. Круги Эйлера. Формула включений и исключений.
    3. Размещения, перестановки и сочетания. Бином Ньютона. Треугольник Паскаля. Сочетания с повторениями.

    Теория вероятностей:

    1. Основные понятия теории вероятностей. Определение вероятностного пространства, простейшие дискретные случаи (выборки с порядком и без него, упорядоченные и неупорядоченные), классическая вероятностная модель.
    2. Геометрическое определение вероятности.
    3. Независимость событий. Попарная независимость и независимость в совокупности.
    4. Условная вероятности, формула полной вероятности, формула Байеса.
    5. Случайная величина, функция распределения.
    6. Математическое ожидание, дисперсия, корреляция, их свойства.
    7. Стандартные дискретные и непрерывные распределения, их математические ожидания, дисперсии и свойства (Бернулли, биномиальное, равномерное, нормальное, Пуассона)
    8. Неравенство Чебышева. Закон больших чисел. Центральная предельная теорема.

    Алгоритмы:

    (Предполагается владением одним из императивных языков программирования)

    1. Простейшие конструкции языка программирования. Циклы, ветвления, рекурсия.
    2. Анализ алгоритмов. Понятие о сложности по времени и по памяти. Асимптотика, О-символика.
    3. Массивы, стеки, очереди, связные списки. Сравнение временных затрат при различных типах операций.
    4. Сортировки. Нижняя теоретико-информационная оценка сложности задачи сортировки. Алгоритмы сортировки вставками, пузырьком, быстрая сортировка, сортировка слиянием. Оценка сложности.
    5. Задача поиска подстроки в строке. Оценка сложности.
    6. Графы, деревья. Поиск кратчайшего пути в графе. Оценка сложности.

    Математический анализ:

    1. Предел последовательности и функции. Замечательные пределы.
    2. Непрерывность функции в точке, непрерывные функции.
    3. Числовые ряды. Признаки сходимости. Абсолютно и условно сходящиеся ряды.
    4. Дифференцирование функций. Применение производной для нахождения экстремумов функций. Формула Тейлора, правило Лопиталя.
    5. Функции многих переменных. Частные производные. Градиент и его геометрический смысл. Гессиан. Метод градиентного спуска. Поиск экстремумов функций от многих переменных.
    6. Определенный и неопределенный интегралы. Методы интегрирования функций. Первообразные различных элементарных функций. Кратные интегралы (двойные, тройные), замена координат, связь с повторными.

    Линейная алгебра:

    1. Системы линейных уравнений. Прямоугольные матрицы. Приведение матриц и систем линейных уравнений к ступенчатому виду. Метод Гаусса.
    2. Линейная зависимость строк (столбцов) матрицы. Основная лемма о линейной зависимости, базис и ранг системы строк (столбцов). Ранг матрицы. Критерий совместности и определенности системы линейных уравнений в терминах рангов матриц. Фундаментальная система решений однородной системы линейных уравнений.
    3. Определитель квадратной матрицы, его основные свойства. Критерий равенства определителя нулю.
    4. Операции над матрицами и их свойства. Теорема о ранге произведения двух матриц. Определитель произведения квадратных матриц. Обратная матрица, ее явный вид (формула), способ выражения с помощью элементарных преобразований строк.
    5. Собственные вектора и собственные числа матрицы
        Подготовка
        Освежить или дополнить знания можно с помощью онлайн-курсов:

        Если вы считаете, что вам не хватает навыков программирования, могут быть полезны онлайн-курсы:

        Для получения дополнительной практики в программировании алгоритмических задач можно воспользоваться платформой Rosalind.
        Преподаватели Института биоинформатики
        Алиса Аленичева
        Алгоритмы в биоинформатике
        Дарья Балашова
        Дискретная математика
        Юрий Барбитов
        Молекулярная биология, эволюция, филогенетика
        Юрий Белоусов
        Статистика для информатиков
        Ольга Бочкарева
        Сравнительная геномика прокариот
        Артем Васильев
        Дискретная математика
        Лаврентий Данилов
        Статистика и анализ данных в R, машинное обучение
        Константин Зайцев
        Анализ экспрессии генов
        Геннадий Захаров
        Command-line tools for bioinformatics
        Наталья Зенкова
        Статистика для информатиков
        Александр Ильин
        Программирование на Python
        Елена Картышева
        Статистика для информатиков
        Антон Коробейников
        Статистика для информатиков
        Нина Лукашина
        Алгоритмы в биоинформатике,
        Машинное обучение
        Алиса Моршнева
        Практикум по биоинформатике
        Михаил Райко
        Практикум по биоинформатике
        Яна Сафонова
        Иммуногеномика
        Павел Синицын
        Протеомика
        Александр Слепченков
        Программирование на Python
        Владислав Страшко
        Статистика и анализ данных в R, машинное обучение
        Александр Ткаченко
        Анализ экспрессии генов
        Дополнительная информация
        Отзывы выпускников
        Мы собрали для вас ответы на часто задаваемые вопросы.
        Если вы не нашли свой вопрос — пишите на info@bioinf.me.

        Подписаться на новости Института биоинформатики

        Программы профессиональной переродготовки по биоинформатике