Летняя школа по биоинформатике 2018

23–28 июля | Санкт-Петербург

Программа
Научная программа школы включает лекции, практические занятия и научные проекты по биоинформатике в исследованиях рака, а также общие занятия по предметам, полезным биоинформатикам в разных областях.

Летняя школа поделена на два потока:
  • Биоинформатика для информатиков и математиков.
  • Биоинформатика для биологов и медиков.

В лекционной программе школы:

  • Работа с данными NGS.
  • Методы вычислительной и системной биологии.
  • Популяционная генетика.
  • Методы диагностики злокачественных новообразований.
  • Биоинформатические подходы в изучении геномики и транскриптомики рака.
  • Молекулярное моделирование лекарств для таргетной терапии.
  • Современные достижения в изучении молекулярных процессов в опухоли.
и многое другое.

    Подробное расписание
      Практические интенсивы:

      Практические занятия в этом году не будут строго делиться на занятия для биологов и информатиков, но останутся рекомендации по участию в соответствии с уровнем подготовки. Если рекомендаций нет — к участию приглашаются все желающие. Участники смогут самостоятельно выбрать интересные им занятия.

      Логическим продолжением занятий будет решение практической задачи — проекта. Работа над проектом не является обязательной и выполняется по желанию небольшой группой из 4-6 человек под руководством преподавателя практики. За время школы будет возможность поучаствовать в нескольких проектах.

      Ниже можно найти описание практических занятий, а также необходимое к установке (до начала школы!) программное обеспечение:

      *рекомендовано для биологов
      ** рекомендовано для информатиков
        Обработка данных на Python*
        Преподаватель: Константин Зайцев, Университет ИТМО

        Применение техник машинного обучения в исследовании рака.
        Введение в машинное обучение на Python.

        Неоходимое ПО: Все необходимые пакеты есть внутри дистрибутива anaconda. Именно этот дистрибутив рекомендован к установке: https://www.anaconda.com/download/ python3.6

        Проект: Сравнительный анализ LUAD и LUSC раков легких на основе данных TCGA.
        Управление вычислениями (работа с пайплайнами)*
        Преподаватель: Геннадий Захаров, EPAM

        В курсе будет рассмотрено построение пайплайна - создание из готовых утилит системы для выполнения расчетной задачи. В процессе выполнения практики будет рассмотрен набор утилит командной строки.

        Неоходимое ПО: Любой дистрибутив Linux, установленный в виртуальной машине или на «железе.

        Проект: Пример построения пайплайна обработки данных 4С-секвенирования.
        Методы MCMC в биоинформатике**
        Преподаватели: Никита Алексеев (Университет ИТМО), Мария Черниговская (ЦАБ СПбГУ)

        Ключевые темы: семплирование «конечномерных случайных величин vs семплирование в больших пространствах;
        MCMC алгоритмы для семплирования, примеры, свойства, проблемы;
        MCMC для решения задач оптимизации;
        биоинформатические методы, основанные на использовании MCMC.

        Неоходимое ПО:
        1. R (Мы рекомендуем поставить пакеты ggplot2, dplyr, data.table, pheatmap, mcmc)
        2. R-studio
        3. Python 3 (Рекомендуем поставить anaconda https://www.anaconda.com/download/ python3.6) + jupyter notebook (если вы установили anaconda, то устанавливать jupyter notebook отдельно не нужно)
        4. mrBayes (http://mrbayes.sourceforge.net/download.php)
        5. Dendrix (http://compbio.cs.brown.edu/projects/dendrix/ Latest release: ver0.3, February 4, 2013)
        Алгоритмы в анализе данных NGS**
        Преподаватели: Андрей Пржибельский, ЦАБ СПбГУ

        На данных практиках будут рассмотрены классические алгоритмы выравнивания, такие как алгоритмы Нидлмана-Вунша и Смита-Уотермана, а также их некоторые модификации (линейная память, линейная память с ограниченным количеством ошибок, Аффинная модель вставки, множественное выравнивание). Далее студентам будет предложено реализовать эти алгоритмы на любимом языке программирования. Для более продвинутых в плане программирования студентов можно предложить более интересные алгоритмы, такие как суффиксный массив, выравнивание через seed and extend, итд.

        Необходимое ПО: Python или любой другой императивный язык на котором можно будет быстро писать несложные (и сложные) программы.

        Проект: Поиск геномных повторов с помощью графа де Брюйна. В случае успешного выполнения первой части можно добавить классификацию повторов. От 1 до 4 человек.

        Необходимые навыки: умение реализовывать в коде различные (порой нетривиальные) алгоритмы, желание придумывать новые алгоритмы и анализировать данные, работать над одним кодом в команде.
        Диагностика структурных вариаций в парах опухоль — здоровая ткань
        Преподаватель: Герман Демидов, Universitat Pompeu Fabra/Institut für Medizinische Genetik und angewandte Genomik

        Поиск CNV/CNA в germline/somatic контекстах на примере нескольких тулов.

        Необходимое ПО: GATK 4.0.6 или старше, R, R-studio
        Анализ данных в R*
        Преподаватель: Алексей Сергушичев, Университет ИТМО

        В курсе будут рассмотрены основы работы с клиническими данными и данными экспрессии в R. Мы найдем, какие факторы влияют на выживаемость пациентов и посмотрим, какие молекулярные пути могут быть с этим связаны.
        Ключевые слова: TCGA, анализ выживаемости, дифференциальная экспрессия.

        Необходимое ПО: R версии 3.5, RStudio
        Необходимые пакеты: GenomicDataCommons, magrittr, dplyr, survival, limma, ggplot2, ggrepel, org.Hs.eg.db, reactome.db, fgsea, clusterProfiler

        Проект: Анализ молекулярных подтипов рака.
        Команде будет необходимо выбрать один из тип раков из базы TCGA и выполнить максимально подробное описание его молекулярных подтипов: какие они бывают, с чем могут быть связаны, как они влияют на выживаемость и т.д.
        Все вопросы и комментарии по установке ПО можно направлять в чат в Slack.
        Мы создали документ с рекомендованными материалами по подготовке ко всем практикам и лекциям школы. Пожалуйста, ознакомьтесь с наиболее незнакомыми темами.
        Партнеры
        Контакты
        По всем вопросам пишите на summer@bioinf.me, но заранее ознакомьтесь с ответами на самые распространенные вопросы.