Онлайн-школа
по биоинформатике

10 — 12 июля 2020

О школе
В течение трех дней программа школы познакомит участников с некоторыми областями биоинформатики. Часть вводных лекций будет сопровождаться практиками для более детального знакомства с конкретной областью. Темы включают: анализ данных NGS и RNA-seq, системную биологию, сборку и анализ геномов и транскриптомов, а также хемоинформатику.

Участие в школе по итогам отбора бесплатное.

Вся школа будет проходить в Zoom.
Программа
Научная программа школы включает лекции и проекты из разных областей биоинформатики, практические занятия по предметам, необходимым современному биоинформатику.

Летняя школа проходит в два потока:

  • Биоинформатика для информатиков и математиков.
  • Биоинформатика для биологов и медиков.
Для школы в онлайн формате, мы оставляем возможность выбора интересующих практик за участниками.

У участников будет возможность пообщаться с лекторами за виртуальным кофе.
Расписание школы

Пятница, 10 июля

Условные обозначения:
* — рекомендовано для биологов
** — рекомендовано для информатиков
11:30 – 11:50
11:30 – 11:50
Открытие
12:00 – 12:50
12:00 – 12:50
Биоинформатика в 2025: чего ждать в следующие 5 лет? | открытая лекция
В течение последних 10 лет геномная биоинформатика пережила стремительный рост популярности и стала обязательной частью практически всех наук о живом. Причина этому — революционный прогресс методов и падение стоимости секвенирования ДНК. Развитие биоинформатики в последнюю декаду сопровождалось типичными болезнями роста времен «золотой лихорадки» — выбором скорости публикации и яркости пресс-релизов в ущерб качеству, «хайпом» и сильно разнящимся профессионализмом людей в отрасли. Встала ли биоинформатика на путь исправления?

В лекции будет представлен обзор прогресса в биоинформатике секвенирования. Александр расскажет и о своем видении, как она будет развиваться в ближайшие 5 лет, и какие направления представляются самыми перспективными.

Мы обсудим секвенирование длинными прочтениями, расширение возможностей современной эпидемиологии и инфекционной медицины за счет геномных исследований, а также развитие транскриптомики одиночных клеток.

Лекция открыта для всех желающих, можно присоединиться по ссылке.
13:00 – 13:50
13:00 – 13:50
(1) Введение в технологии секвенирования и форматы данных | лекция
В данной вводной лекции мы рассмотрим основные принципы получения и хранения данных в биоинформатике. Мы поговорим о том, как в современных приборах осуществляется процесс секвенирования, в каких форматах хранятся сырые и предобработанные данные секвенирования, а также о том, как облачные технологии и платформы позволяют упростить работу с большими биоинформатическими данными.
14:00 – 15:00
14:00 – 15:00
Обед
15:00 – 16:30
15:00 – 16:30
(1) 4 буквы и куча проблем. Форматы данных и best practices * | практика
Михаил Райко | ЦАБ СПбГУ
На семинаре мы познакомимся с основными форматами данных, которые применяются в биоинформатике. Немного поговорим о том, как их можно хранить и преобразовывать, посмотрим на несколько типичных задач и инструментов для их решения (ключевые слова – awk, cut, grep, samtools, bedtools). В общем, это будет история про то, как не изобретать велосипеды.

Необходимое ПО:
15:00 – 16:30
15:00 – 16:30
(2) Молекулярная биология ** | лекция
Знания в области молекулярной биологии необходимы для понимания основ биоинформатики. В ходе данной лекции мы кратко рассмотрим основы молекулярной биологии и поговорим о том, почему у современных биологов появилась потребность в работе с большими данными. Мы рассмотрим вопросы структуры генома, принципы функционирования (экспрессии) генов и основные механизмы того, как живые организмы отвечают на внешние воздействия. Лекция является вводной для студентов математических и информатических специальностей.
17:00 – 18:30
17:00 – 18:30
(1) Оценка дифференциальной экспрессии генов по данным микрочипов * | практика
В ходе встречи разберем основные принципы работы микрочипов (microarray) применительно к задаче оценки уровня экспрессии генов. Во время практической части занятия мы будем учиться загружать открытые данные мичкрочипов, собранные в ходе предыдущих исследований, проводить их предобработку и анализ в удобном веб-инструменте Phantasus. В конце попробуем визуализировать полученных результаты и сделать содержательные выводы.

Необходимое ПО:
17:00 – 18:30
17:00 – 18:30
(2) Машинное обучение в биомедицинских данных ** | лекция
Елена Чуклина | Novartis
Зоя Червонцева | Сколтех, ИППИ РАН
В ходе занятия будет рассмотрено понятие биомаркеров и то, как и насколько хорошо для их поиска работает машинное обучение. В лекции изучим различные методы машинного обучения и пошаговый алгоритм реализации. На примерах будет показано, как это можно использовать в медицине на реальных протеомных данных и результатах анализа дифференциальной экспрессии генов.
18:45 – 19:45
18:45 – 19:45
(1) Кофе и дискуссии
Лекторы и участники обсуждают насущные вопросы за виртуальным кофе.
Суббота, 11 июля
11:00 – 11:45
11:00 – 11:45
(1) Кофе и дискуссии
Лекторы и участники обсуждают насущные вопросы за виртуальным кофе.
12:00 – 12:50
12:00 – 12:50
(1) Вычислительные методы в анализе данных масс-спектрометрии | лекция
Алексей Гуревич | ЦАБ СПбГУ
Тандемная масс-спектрометрия — мощный аналитический инструмент, применяемый в протеомике, биохимии, разработке новых лекарств и многих других областях. При этом данные масс-спектрометрии устроены значительно сложнее, чем данные NGS и их анализ требует применения нетривиальных вычислительных методов. На лекции мы рассмотрим базовые понятия и принципы масс-спектрометрии, посмотрим как выглядят данные такого типа, обсудим какие вычислительные задачи возникают при их анализе и как они решаются в современных биоинформатических программах.
13:00 – 13:50
13:00 – 13:50
(1) Публикации – что-где-когда | лекция
Олег Шпынов | JetBrains Research
Лекция будет посвящена тому, как люди работают с научными публикациями. Как находить важное, видеть тренды, и можно ли заранее предсказать успешность статьи?
14:00 – 15:00
14:00 – 15:00
Обед
15:00 – 16:30
15:00 – 16:30
(1) Конференция участников
Участники, уже начавшие заниматься биоинформатическими проектами, представляют свои доклады. Жюри выберет лучший доклад, а аудитория будет выбирать победителя номинации "приз зрительских симпатий".
17:00 – 18:30
17:00 – 18:30
(1) Введение в Biopython * | практика
Лекция посвящена основам работы c биологическими данными и базами NCBI с использованием языка Python и модулей проекта Biopython.

Необходимое ПО:
17:00 – 18:30
17:00 – 18:30
(2) Введение в алгоритмы ** | практика
Андрей Пржибельский | ЦАБ СПбГУ
На практических занятиях слушатели познакомятся с современными программами и библиотеками для работы с выравниваниями, а также попробуют написать некоторые алгоритмы самостоятельно.

Необходимое ПО:
  • Stepik
  • Интерпретатор для своего языка программирования
19:00 – 20:00
19:00 – 20:00
(1) Population genomics of the critically endangered spoon-billed sandpiper | лекция
Федор Кондрашов | IST Austria
The nature of genetic changes contributing to species extinction and impeding population recovery remains poorly understood. I will talk about our study of the population genetic history of the critically endangered spoon-billed sandpiper and its sister species, the red-necked stint, which is of least concern.

Using whole-genome data, we found that while the red-necked stint population was relatively constant across 200,000 years, the spoon-billed sandpiper population peaked 15,000-25,000 years ago during the last glacial maximum, when suitable breeding habitat was likely abundant, and has been declining since.

However, the level of heterozygosity of the spoon-billed sandpiper remains high, higher than is expected either in an equilibrium state, or if the population has gone through a recent bottleneck. Using modelling, we observe that the increase of the population that occurred prior to the ongoing decline could have led to accumulation of recessive deleterious polymorphisms, imposing an additional burden on the spoon-billed sandpiper population.

Thus, complex demographic changes leading to gain of deleterious genetic diversity may pose a risk to species survival and recovery by increasing the cost of inbreeding. Specifically, species that had greater habitat availability during the last glacial maximum may be especially prone to this effect.
20:10 – 21:10
20:10 – 21:10
(1) Не_только_кофе и дискуссии
Лекторы и участники общаются о жизни и биоинформатике.
Воскресенье, 12 июля
11:00 – 11:45
11:00 – 11:45
(1) Кофе и дискуссии
Лекторы и участники обсуждают насущные вопросы за виртуальным кофе.
12:00 – 14:00
12:00 – 14:00
(1) Как поймать правильную рыбу. Сборка и анализ вирусов на примере исходного варианта SARS-CoV-2 | практика
Михаил Райко | ЦАБ СПбГУ
Сборка и анализ геномов и особенно метагеномов может потребовать довольно много вычислительных ресурсов. Поэтому мы будем тренироваться "на кошках" – вирусах, и в качестве примера разберем на реальных данных, как учёные обнаружили возбудителя the virus и узнали последовательность его генома. Начнем с исходных метатранскриптомных ридов, закончим статьёй в Nature.

Необходимое ПО:
14:00 – 15:00
14:00 – 15:00
Обед
15:00 – 16:30
15:00 – 16:30
(1) Введение в анализ данных GWAS | практика
Полногеномный анализ ассоциаций (GWAS) – это основной метод, используемый в современной геномике для поиска генетических факторов, определяющих самые разные признаки у человека и других организмов. На этом занятии мы поговорим о том, как выглядит типичный дизайн GWAS-исследования, какие вопросы могут стоять перед учеными, работающими с GWAS-данными, а также о том, как правильно производить обработку и анализ данных. Для закрепления полученных знаний мы проведем некоторые этапы анализа на небольших тестовых данных.

Необходимое ПО:
  • R, пакет qqman
  • создать аккаунт в FUMA
17:00 – 18:30
17:00 – 18:30
(1) Методы сравнительной геномики прокариот и их применение для задач эволюционной биологии и биомедицины | лекция
Ольга Бочкарева | IST Austria
В рамках лекционной части мы разберем основные эволюционные процессы, происходящие в геномах прокариот, и их влияние на фенотип. Подробно поговорим про такие процессы, как гомологичная рекомбинация и горизонтальный перенос генов, а также затронем проблему построения филогенетических деревьев для бактериальных популяций.

Далее мы разберем ряд свежих публикаций, в которых методами сравнительной геномики были выявлены генетические факторы, сформировавшие новые фенотипические свойства патогенов человека.

В рамках практики мы повторим часть этих исследований, использую программы для построения ортологических рядов и синтенных блоков, филогенетической реконструкции и визуализации генетических маркеров.

Необходимое ПО:
17:00 – 18:30
17:00 – 18:30
(2) Хемоинформатика и дизайн малых молекул ** | практика
Павел Полищук | Университет Палацкого в Оломоуце, Чехия
Тимур Маджидов | КФУ

Хемоинформатика есть применение информационных технологий к решению химических проблем. При этом самой желанной целью и задачей химии, в конечном итоге, является создание молекул, обладающих желаемыми свойствами. Создание лекарственных препаратов, как малых молекул с набором определенных параметров биоактивности, является одной из таких задач. В ходе нашего занятия мы дадим широкий взгляд на задачи и достижения хемоинформатики. Кроме того, на практическом примере мы рассмотрим, как можно применять один из инструментов хемоинформатики – фармакофорное моделирование – для дизайна молекул с заданной биоактивностью. Покажем, как создавать фармакофорные модели, как валидировать и как использовать их для виртуального скрининга (поиска молекул с желаемыми свойствами).

Необходимое ПО:
18:45
18:45
(1) Закрытие
Подписаться на новости Института биоинформатики

Онлайн-школа
по биоинформатике

10 — 12 июля 2020