Research projects
Academic year 2019/20

Использование искусственных нейронных сетей для анализа вторичной структуры биологических последовательностей | СПбГУ / JetBrains Research (PLT Lab)

студенты: Кутленков Дмитрий, Конгоев Михаил
руководитель: Григорьев Семён
Известно, что формальные граммтики --- достаточно выразительный способ описания особенностей вторичной структуры. При этом, из-за особенностей реальных данных, приходится использовать вероятностные граммтики, что значительно усложняет и инструменты и процесс построения таких граммтик. Мы предлагаем использовать обычные контекстно-свободные граммтики, а в качестве вероятностной модели использовать нейронные сети.

В рамках осеннего семестра предлагается подготовить всё необходимое для того, чтобы создать нейронную сеть, способную предсказывать вторичную структуру цепочек. А если останется время, то и обучить такую сеть.

Слайды
Использование искусственных нейронных сетей для анализа вторичной структуры биологических последовательностей | СПбГУ / JetBrains Research (PLT Lab)

студенты: Кутленков Дмитрий, Конгоев Михаил
руководитель: Григорьев Семён
Известно, что формальные граммтики --- достаточно выразительный способ описания особенностей вторичной структуры. При этом, из-за особенностей реальных данных, приходится использовать вероятностные граммтики, что значительно усложняет и инструменты и процесс построения таких граммтик. Мы предлагаем использовать обычные контекстно-свободные граммтики, а в качестве вероятностной модели использовать нейронные сети.

В рамках осеннего семестра предлагается подготовить всё необходимое для того, чтобы создать нейронную сеть, способную предсказывать вторичную структуру цепочек. А если останется время, то и обучить такую сеть.

Слайды
Импутация снипов с использованием данных генотипирования на чипах | Мираторг Генетика

студент: Файзуллина Камилла
руководители: Жегалова Ирина, Черняева Екатерина
Импутация – процесс "достраивания" отсутствующих снипов в генотипе с использованием референсной популяции. Импутация является одним из ключевых этапов протокола предобработки и контроля качества любого генетического исследования.
Использование более высокой плотности маркеров может привести к лучшим результатам, даже если индивидуумы не были генотипированы по большинству маркеров, кроме того, это позволяет заместить маркеры валидными значениями, в случаях, когда в точности генотипа мы не уверены.
Однако, большинство алгоритмов для импутации были первоначально разработаны для использования в генетике человека и поэтому оптимизированы для высокого уровня генетического разнообразия. Основной же особенностью сельскохозяйственной генетики является наличие большого количества близкородственных связей и потому умеренный уровень генетического разнообразия. Споры о пригодности тех или иных алгоритмов, равно как и о поиске "лучшего" алгоритма все еще ведутся. Потому основной целью проекта является реализация пайплайна для импутации снипов у коров для чипов разной плотности.
Определение породных примесей у коров | Мираторг Генетика

студенты:
руководители: Жегалова Ирина, Черняева Екатерина
Сможете ли вы, глядя на стейк, определить Black Angus это или Вайгю? Или, может быть, Голштин? А ваш алгоритм сможет! Нет, мы не будем прикручивать image recognition, мы посмотрим внутрь клеток, а именно – на генетику.
Поддержка высокого качества продукции не в первую очередь зависит от породы животного, от которого они были получены, потому стейки от Ангусов стоят своих денег. В целом, оценка состава породы по геномным данным имеет множество преимуществ, включая более высокую точность в сравнении с основанной на фенотипах, независимость от отсутствующих, неполных или неточных фенотипических записей, а также возможность использования в качестве независимого подтверждения породы.
Существуют программы ADMIXTURE и другие, которые данную задачу реализуют, однако, они очень чувствительны к размеру каждого кластера – большие кластеры "оттягивают" на себя, вызывая "схлопывание" мелких. Потому целью проекта является реализация скриптов для определения породных примесей, основываясь на https://bmcgenet.biomedcentral.com/articles/10.1186/s12863-018-0654-3.
GWAS для определения особенностей метаболизма и поиск ассоциаций с заболеваниями | Мираторг Генетика

студенты: Карпова Наталия, Куреев Николай

руководители: Жегалова Ирина, Черняева Екатерина
GWAS, или полногеномный анализ ассоциаций, ответствен за поток открытий с точки зрения генетических факторов риска для заболевания или исследования причинно-следственной связи между генотипами и фенотипическими признаками. Исследования основаны на том, что есть большая когорота, в которой у каждого есть исследуемый признак\болезнь, и когорта, у которых этого признака\заболевания нет. И затем, просматривая весь геном с использованием SNP, вы пытаетесь найти мутацию, которая встречается у больных и нет у здоровых. Прелесть GWAS в том, что он помог нам преодолеть подход генов-кандидатов, который был довольно разочаровывающим, потому что большинство кандидатов не подтвердились расчетами, и вместо этого исходит из теории, что весь набор генов - кандидаты, давайте рассмотрим все из них. И вот стратегия, которая является достаточно всеобъемлющей, чтобы позволить вам сделать это.
Цель проекта – изучить связи фенотипов – хозяйственно важных признаков и заболеваний – и генотипов у коров породы Black Angus.

Слайды
Dashboard for exploratory data analysis of large-scale immune repertoires | ImmunoMind

студент: Уразбахтин Шамиль

руководитель: Назаров Вадим
Адаптивная иммунная система - "невидимая рука" организма, направляющая триллионы лимфоцитов на защиту от различных патогенов. Ключевая особенность адаптивного иммунитета заключается в уникальной системе генерации его основных агентов - Б- и Т-клеточных рецепторов, которые находятся на поверхности соответствующих лимфоцитов. Вместо кодирования огромного объема информации о белках-рецепторах в геноме, организм генерирует случайные последовательности рецепторов в процессе соматической рекомбинации генов.

В процессе столкновения с различными заболеваниями, первоначально сгенерированное множество рецепторов - "репертуар" - изменяет свою структуру: некоторые рецепторы отфильтровываются, некоторые, наоборот, увеличивают свою численность в ответ на атаки вирусов или бактерий. Таким образом, иммунные репертуары сохраняют в себе историю борьбы с заболеваниями и текущее состояние иммунитета. Они содержат в себе много ценной информации, которую человечеству еще придется раскрыть - эта подобласть иммунологии появилась примерно десять лет назад.

Развитие технологий секвенирования позволило идентифицировать геномные последовательности для сотен тысяч вариантов клеточных рецепторов в образце крови или исследуемой ткани. Анализ таких данных позволяет, например, понять, что вызывает аутоиммунные заболевания, почему люди умирают от иммунотерапии, а также как изменяется иммунитет с возрастом.

Однако для эффективных исследований необходимы эффективные инструменты. На данный момент в мире существует всего два биоинфоматических пакета, которые позволяют удобно и быстро анализировать данные иммунных репертуаров - VDJtools и R пакет immunarch. В данной работе вам предлагается сделать immunarch еще более удобным для исследователей. Поскольку многие статьи дублируют методы анализа клеточных рецепторов, то это открывает возможность для оптимизации научного процесса и минимизации страданий исследователей. Разработав интерактивный дашборд, которые содержит в себе все самые встречаемые методы и визуализации для анализа иммунных репертуаров, можно сильно сократить время, которые исследователи тратят на программирование одних и тех же пайплайнов анализа, совершая каждый раз разные ошибки.

Цель проекта: ускорить процесс генерации научных инсайтов и минимизировать бессмысленные страдания исследователей за счет разработки интерактивного дашборда с наиболее часто встречаемыми подходами к анализу репертуаров иммунных рецепторов.

Слайды
Fast statistical inference of the generation probability of immune receptors | ImmunoMind

студенты:
руководитель: Назаров Вадим
Адаптивная иммунная система - "невидимая рука" организма, направляющая триллионы лимфоцитов на защиту от различных патогенов. Ключевая особенность адаптивного иммунитета заключается в уникальной системе генерации его основных агентов - Б- и Т-клеточных рецепторов, которые находятся на поверхности соответствующих лимфоцитов. Вместо кодирования огромного объема информации о белках-рецепторах в геноме, организм генерирует случайные последовательности рецепторов в процессе соматической рекомбинации генов.

В процессе столкновения с различными заболеваниями, первоначально сгенерированное множество рецепторов - "репертуар" - изменяет свою структуру: некоторые рецепторы отфильтровываются, некоторые, наоборот, увеличивают свою численность в ответ на атаки вирусов или бактерий. Таким образом, иммунные репертуары сохраняют в себе историю борьбы с заболеваниями и текущее состояние иммунитета. Они содержат в себе много ценной информации, которую человечеству еще придется раскрыть - эта подобласть иммунологии появилась примерно десять лет назад.

Развитие технологий секвенирования позволило идентифицировать геномные последовательности для сотен тысяч вариантов клеточных рецепторов в образце крови или исследуемой ткани. Анализ таких данных позволяет, например, понять, что вызывает аутоиммунные заболевания, почему люди умирают от иммунотерапии, а также как изменяется иммунитет с возрастом. Для такого анализа было бы полезно иметь вероятности генерации тех или иных рецепторов. Кроме ценности для фундаментальной науки - создание модели генерации иммунитета - это имеет и практический смысл. В частности, это позволило бы точнее выделять рецепторы, ответственные за аутоиммунитет, что привело бы к улучшению диагностики аутоиммунных заболеваний.

Модель генерации рецепторов возможно описать математически. На данный момент существующие биоинформатические софты для оценки вероятностей генерации рецепторов по их последовательности обладают рядом недостатков. Опуская классический недостаток научного программного обеспечения, а именно - немедленное прекращение поддержки софта после его публикации - эти софты обладают медленной скоростью работы и чрезвычайно неудобны в использовании для конечного пользователя. В данном проекте предлагается решить эти проблемы, разработав удобный, логичный и быстрый софт для вывода параметров вероятностной модели генерации иммунных рецепторов.

Цель проекта: разработать удобный для конечного пользователя и быстрый софт для статистического вывода параметров вероятностной модели генерации иммунных рецепторов.
Оценка дифференцильной экспрессии изоформ генов интереса | ФГБУ «НИИ гриппа им. А.А. Смородинцева» Минздрава России

студенты: Цыба Дарья, Окорокова Лариса, Алексеев Дмитрий
руководители: Станевич Оксана, Бакин Евгений
В проекте предлагается оценить дифференциальную экспрессию изоформ генов - сначала на примере генов модельных организмов (дрожжи/C.elegans/дрозофила), затем, если останется время, на примере данных РНК-секвенирования из образцов рака молочной железы человека. Оценку дифференциальной экспрессии изоформ генов будет предложено произвести с использованием существующего пайплайна на инструменте Cufflinks. В случае успешного освоения пайплайна будет дана возможность сравнить свой результат с имеющимся - на данных из образцов рака молочной железы.

Слайды
Разработка имитационной модели для формировании V-D и D-J регионов в последовательностях иммуноглобулинов | Институт Биоинформатики

студенты: Жукова Наталия, Репинская Жанна
руководители: Станевич Оксана, Бакин Евгений
V-D и D-J регионы CDR3-зоны иммуноглобулинов играют важную роль в обеспечении разнообразия репертуара антител и, как следствие, способности организма защищаться от различных патогенов. В рамках предыдущих студенческих проектов были созданы вероятностные модели для формирования регионов CDR3 зоны. Анализ показал, что, в силу некоторых введенных допущений, в ряде случаев модель обеспечивает недостаточно высокую точность. В данном проекте предлагается построить более точную, имитационную модель и с ее помощью проанализировать вклад различных механизмов в формирование указанных регионов.

Слайды
Обработка данных РНК-секвенирования с целью изучения функций белка Pcbp1 | Институт Биоинформатики

студент: Потапенко Евгений
руководители: Станевич Оксана, Бакин Евгений
Pcbp1 является представителем семейства KH-доменных поли(Ц)-связывающих белков и участвует в регуляции множества процессов – транскрипции, трансляции и сплайсинге. В частности, существует гипотеза о важной роли Pcbp1 при переходе плюрипотентных стволовых клеток из раннего (наивного) в позднее (праймированное) состояние. В лаборатории молекулярной биологии стволовых клеток института цитологии РАН были получены 12 проб для анализа RNA-seq – по 3 биологических повторности дикого типа и нокаутных клеток в исходном и праймированном плюрипотентном состоянии. Целью данного проекта является оценка дифференциальной экспрессии генов в данных образцах для лучшего понимания вовлеченности Pcbp1 в различные сигнальные пути.

Слайды
Апробация вероятностной модели формирования V-D и D-J зон CDR3 региона тяжелой цепи иммуноглобулинов на открытых данных | Институт Биоинформатики

студент: Петросян Степан
руководители: Станевич Оксана, Бакин Евгений
Студентам предлагается апробировать вероятностную модель формирования N1/N2 зон региона CDR3-VH иммуноглобулинов мышей и человека на ряде отобранных открытых данных.

Слайды
Exploring properties of amino acids in immunoglobulin clonal lineages | UCSD

студент: Меженская Дарья
руководитель: Сафонова Яна
An antibody repertoire can be viewed as a collection of clonal lineages. Each clonal lineage presents a result of somatic hypermutagenesis and clonal selection and thus can be described as an evolutionary tree. The goal of this project is to analyze somatic hypermutations appearing in expanded clonal lineages and reveal associations between immunoglobulin positions and properties of amino acids generated through the mutation process.

Слайды
Phenome-wide functional analysis of human genetic association data | Институт биоинформатики

студенты: Масликова Татьяна, Догонашева Олеся, Ушаков Михаил, Чангалиди Антон
руководители: Барбитов Юрий, Шиков Антон
Проект является продолжением работы нашей группы, опубликованной в виде препринта на bioRxiv (https://www.biorxiv.org/content/10.1101/672758v1). Мы интересуемся тем, какие гены и группы генов определяют различные группы признаков у человека. В данной работе мы хотим уйти от анализа отдельных генетических вариаций и их комбинаций к генам за счет аккуратной оценки степени ассоциации каждого гена с признаком. Получив такие оценки, мы хотим использовать различные статистические методы для функционального анализа фенома человека.

Слайды
Охарактеризовать представителей Bacteroidetes и Firmicutes в кишечных микробиомах подростков | Научный центр проблем здоровья семьи и репродукции человека

студенты: Сарана Юлия, Селезнева Елизавета

руководитель: Белькова Наталья
Bacteroidetes и Firmicutes – это две филы бактерий, доминирующие в кишечных микробиомах человека. Их представленность и соотношение изменяется в течение жизни человека, зависит от генетических, средовых, социально-экономических и поведенческих факторов (возраст, тип питания, образ жизни и др.) и может опосредованно влиять на состояние здоровья.
Цель настоящего исследования – изучить состав, структуру и разнообразие представителей двух доминирующих фил бактерий в кишечных микробиомах подростков с разным индексом массы тела.
Вывод демографической истории популяций современных людей с помощью метода, основанного на модели Морана | Университет ИТМО

студенты: Биба Дмитрий, Волкова Мария, Яковлева Екатерина

руководитель: Носкова Екатерина
Демографическая истории популяций - история развития этих популяций, включающая в себя такие события как разделения популяций, изменение их численности и миграции. Демографическая история "Out of Africa" - одна из самых популярных историй развития трех популяций: народа Йоруба из Нигерии, европейцев и народа Хань из Пекина. Параметры такие как время разделения популяций, их численность и темпы миграций могут быть получены разными методами. На данный момент существует несколько программных обеспечений позволяющих вывести параметры по таким данным как аллель-частотный спектр (распределение частот аллелей в популяциях): например dadi (Gutenkunst et al., 2009) и moments (Jouganous et al., 2018). Однако они основаны на математической модели Райта-Фишера, которая описывает частоту аллелей при переходе от одного поколения особей к другому, предполагая, что поколения не пересекаются. Недавно появилось новое программное обеспечение momi2 (Kamm et al.), в основе которого лежит модель Морана, которая позволяет поколениям пересекаться, что делает ее более близкой к реальности. Задачей проекта является вывод параметров демографической истории современных людей с помощью momi2 и сравнение полученных результатов с параметрами, полученными ранее с помощью dadi и moments.

Слайды
Investigation of yeast multilayer molecular network | Институт биоинформатики

студент: Штыкалова Софья
руководители: Барбитов Юрий, Скитченко Ростислав
В последние годы было проведено много экспериментов по систематическому анализу генетических взаимодействий. Например, в одной из работ (https://science.sciencemag.org/content/353/6306/aa...) были проанализированы взаимодействия 23 миллионов пар генов. Также в этой работе были проведены сравнения структуры сетей генетических взаимодействий, коэкспрессии генов и белок-белковых взаимодействий. В нашем проекте мы попробуем интегрировать все три вида данных (GI, co-expression, PPI) и найти в такой многослойной сети интересные паттерны, связанные с функциональными характеристиками генов и их продуктов.

Слайды
Differential mutability of human genome regions | Институт биоинформатики

студент: Мамаева Мария
руководители: Барбитов Юрий, Скитченко Ростислав
Большая часть моделей в популяционной геномике принимает частоту мутирования за константу, которая не зависит от конкретного региона. Однако же, существует достаточно давно обсуждаемая концепция, согласно которой открытый и закрытый хроматин имеют различную подверженность мутагенезу. У этой гипотезы есть подтверждения на модельных организмах и на человеке (https://www.nature.com/articles/nature11273?proof=...). Тем не менее, большая часть результатов была получена с использованием раковых данных и межвидового сравнения. В этом проекте мы хотим оценить локальную частоту мутирования с использованием популяционных данных и определить параметры, влияющие на эту частоту.

Слайды
Inference of coevolutionary events from coalescent trees | Институт биоинформатики

студент: Дерябина Полина
руководители: Барбитов Юрий, Скитченко Ростислав
Коалесцентная теория предоставляет широкий арсенал для популяционногенетического анализа геномных данных. Так, с использованием коалесцентных методов с применением скрытых марковских цепей были сделаны оценки размера динамики размера популяций и даже давления отбора (https://www.nature.com/articles/s41588-018-0177-x). В этом проекте мы хотим использовать метод ASMC (см. статью) для построения локус-специфических коалесцентных деревьев. Такие деревья затем предполагается использовать для нахождения событий совместной эволюции регионов генома, что может говорить об эпистатических взаимодействиях генов.

Слайды
Поиск генетических факторов осложнений беременности | Институт биоинформатики

студент: Царев Александр
руководители: Барбитов Юрий, Скитченко Ростислав
Проект посвящен расшифровке генетических механизмов осложнений беременности. В данной работе мы воспользуемся публичным набором данных UK Biobank (http://www.nealelab.is/uk-biobank). Мы попробуем не только определить наборы значимых маркеров изучаемых фенотипов, но и сделать глубокую функциональную аннотацию результатов и сравнение с результатами других исследований (например, NHGRI GWAS Catalog).

Слайды
Генератор неразрешимых неоднозначностей (roi_amb_analyzer tool) | Parseq Lab

студент: Толмачев Михаил
руководители: Симакова Тамара, Мозгов Сергей
HLA-типирование является необходимым этапом при подборе доноров для трансплантации органов и тканей. HLA - это белки, расположенные на поверхности клетки, обеспечивающие презентацию фрагментов антигенов иммунным клеткам. Разнообразие этих молекул крайне велико, все известные аминокислотные и нуклеотидные последовательности молекул HLA содержатся в специализированной базе данных IMGT HLA, насчитывающей на данный момент около 24 000 вариантов генов HLA. HLA-типирование осуществляется за счет NGS-секвенирования и последующего выравнивания прочтений на базу данных. При этом различные тест-системы покрывают различные регионы генов HLA, в результате чего возникают естественные ограничения метода, связанные с тем, что часть аллелей невозможно дискриминировать по причине того, что различия между ними находятся в непокрытых тест-системой регионах. Выявление таких ограничений является необходимым этапом верификации тест-систем, которую требуется проводить каждый раз после ежеквартальных обновлений базы данных.

Целью проекта является создание инструмента для выявления ограничений тест-систем для HLA-типирования (roi_amb_analyzer tool).

Слайды
Deep Learning for 3D Molecular Interactions | Skoltech

студенты: Кузнецов Игорь, Ефимов Егор, Глубоков Дмитрий, Ковалев Александр

руководители: Попов Петр
Molecules constantly interact with each other, maintaining integrity and functionality of living organisms. Broken molecular interactions typically lead to serious diseases, such as cardiovascular, neurodegenerative diseases, cancer, and others. Nowadays, there is a great need in more efficient, specific and safer drugs that modulate molecular function via atomic interaction. In order to design a chemical with desired modulation activity one needs to known molecular interactions in atomic details. Experimental techniques, such as X-ray crystallography, NMR, and Cryo-electron microscopy are used to determine spatial structures of molecular complexes on sub-nanometer scale and, hence, allow to look at molecular interactions in atomic details. With the growing number of structural information about molecular complexes and powerful computational resources, it is now possible to develop new generation of structural bioinformatics approaches using state-of-the-art machine learning methods.

Слайды (Кузнецов Игорь, Ефимов Егор)
Слайды (Глубоков Дмитрий, Ковалев Александр)
Deep learning approach to determination of local ancestry | Университет Ла Верне

студенты: Веселова Влада, Сметанин Александр
руководитель: Татьяна Татаринова
Большинство людей живущих сейчас на Земле имеют смешанное происхождение. У кого-то есть всего лишь небольшая примесь, кто-то - сплошная мозаика из разных этнических групп. Современные методы определения происхождения хорошо работают для ограниченного набора сценариев смешения. Методы машинного обучения - это новая и многообещающая область, позволяющая эффективно решить эту задачу для всех сценариев.

Слайды
Поиск адаптаций к повышенному содержанию кислорода у байкальских организмов с помощью данных об экспрессии генов | НИИ биологии ИГУ

студенты: Киркилевич Анна, Долгих Александра
руководитель: Дроздова Полина
Кислород необходим для жизнедеятельности практически всех живых организмов, но его избыток опасен, поскольку нарушает равновесие окислительно-восстановительных процессов. Вода озера Байкал насыщена кислородом в значительно большей степени, чем многие другие пресноводные водоёмы. Следовательно, длительно существующая в озере фауна могла эволюционно приобрести адаптации к высокой концентрации растворённого кислорода в течение всего года. В рамках проекта предлагается прицельно изучить различия в системе антиоксидантной защиты байкальских видов амфипод (литоральные виды Eulimnogammarus verrucosus и E. cyaneus) и родственного им вида Gammarus lacustris, который обитает в других водоёмах региона, но не образует стабильных популяций в открытом Байкале.

Слайды
Анализ структуры популяции по данным секвенирования РНК | НИИ биологии ИГУ

студент: Глушкевич Анна
руководитель: Дроздова Полина
Разнообразие особей внутри популяции — показатель, по которому можно судить о происходящих микроэволюционных событиях. Обычно для анализа генетического материала популяций животных используют секвенирование амплифицированных фрагментов митохондриальных (COI) или ядерных (18S) маркерных генов. Информацию об этих последовательностях можно получить и из данных секвенирования нуклеиновых кислот методами NGS. В этом проекте мы сравним разнообразие последовательностей маркерных генов, полученные с помощью разных способов секвенирования для особей одной и той же популяции байкальского эндемичного вида амфипод Eulimnogammarus verrucosus.

Слайды
Филогенетический анализ как инструмент криминалистики | Университет ИТМО

студент: Поденкова Ульяна
руководитель: Алексеев Никита
В последние несколько лет биоинформатика находит себе все новые применения в forensic sciences. В частности, в случаях вспышек вирусных заболеваний, важным вопросом является "кто кого заразил", на который можно ответить с помощью филогенетического анализа штаммов вирусов, найденных у разных пациентов. В рамках проекта предполагается сделать обзор существующих методов и алгоритмов, и, возможно, поучаствовать в разработке новых методов. На проекте уже есть команда из программистов, но присутствие биолога помогло бы сделать нашу деятельность более полезной.

Слайды
Иммуносупрессивные домены в геноме человека | yRisk

студенты: Мураева Ольга, Поздняков Данила, Панков Викентий, Рапота Диана, Охтиенко Анастасия
руководители: Афанасьев Андрей, Ступников Алексей
Идентификация иммуносупрессивных доменов (ISD) в геноме человека, гомологичных ретровирусным.

Слайды (Мураева Ольга, Поздняков Данила, Панков Викентий)
Слайды (Рапота Диана, Охтиенко Анастасия)
Молекулярная мимикрия ВИЧ | ИБХ РАН

студенты: Харламов Владислав, Овсянникова Александра, Кравец Андрей

руководитель: Цветков Василий
Проект нацелен на изучение свойств вируса иммунодефицита человека и его эволюцию в течение срока инфицирования организма. Было показано, что частицы вируса мутируют с высокой скоростью, изменяя молекулы в своём составе таким образом, чтобы избежать иммунного ответа со стороны организма хозяина. В связи с этим было бы интересно показать на данных глубокого и лонгитюдного секвенирования вирусных частиц у больных СПИД, как изменяются физикохимические характеристики поверхностных белков вирусных частиц. Также можно попробовать натренировать классификатор, который позволил бы предсказывать последствия конкретных мутаций вирусного генома.

Слайды (Харламов Владислав
Слайды (Овсянникова Александра, Кравец Андрей)
Участие бактериофага в горизонтальном переносе прокариотических генов в геномы эукариот | Институт Цитологии РАН

студент: Грецова Мария
руководитель: Даугавет Мария
Передача генов из генома одного организма в геном другого неродственного организма называется горизонтальным переносом генов (ГПГ). На сегодняшний день описаны случаи ГПГ из генома прокариот в геном эукариот для большого числа организмов, однако, механизм этого процесса неизвестен. Для асцидий, одной из групп примитивных Хордовых животных, описано два случая ГПГ от прокариотических организмов. Один из них это приобретение гена целлюлозо-синтазы от бактерии Streptomyces sp., описанный Накашима с соавторами (Nakashima et al., 2004). Другой, для асцидии Styela rustica, был описан в нашей работе (Daugavet et al., 2019). Белок асцидии S. rustica, рустикалин, содержит два структурных домена, при этом кодирующая область C концевого домена имеет достоверное сходство с ферментом карбоксипептидазой, описанной ранее только для бактерий и бактериофагов. Как для С концевого домена рустикалина, так и для каталитического домена целлюлозо-синтазы было показано, что их кодирующие области лежат в геноме рядом с потенциальным сайтом встраивания бактериофага - AttP. Таким образом, возможный механизм ГПГ может задействовать бактериофага в качестве вектора переноса генов из генома прокариот в геном эукариот.
Мы предполагаем, что последовательность сайта встраивания бактериофага может помочь обнаружить новые случаи ГПГ в геномах эукариотических организмов. Однако, длина сайта встраивания бактериофага AttP составляет всего 43 нуклеотида, что слишком мало, чтобы достоверно обнаружить его в больших базах данных. Тем не менее, мы знаем, что в гене гомолога рустикалина AttP-подобный сайт расположен внутри интронов N концевого домена. Основываясь на этом, мы провели поиск отдалённых гомологов (HMMER) с использованием аминокислотной последовательности N концевого домена. Последовательности, схожие с N концевым доменом, обычно являются частью более крупных белков. В составе этих белков так же присутствую известные консервативные домены. Несмотря на то, что найденные белки почти исключительно эукариотические, консервативные домены, входящие в их состав (в 98 белках из 124) являются доменами, которые в соответствии с базой данных Pfam типичны для прокариот или бактериофагов. Было идентифицировано девять различных доменов, которые можно классифицировать как бактериальные ферменты, гидролизующие клеточную стенку. На основании этих наблюдений можно сделать вывод, что последовательность схожая с N концевым доменом в эукариотических белках обычно сопровождается типичными прокариотическими доменами. Мы предполагаем, что найденные эукариотические последовательности могут иметь химерное происхождение и некоторые их консервативные домены образовались в результате ГПГ от прокариотических организмов.
Цель проекта:
Подтвердить химерное происхождение найденных последовательностей, содержащих домены типичные для прокариот или бактериофагов.

Слайды
Effect of the proteomic sample pooling on statistical power and type I error rate | СПбГУ

студенты: Гурина Алёна, Озерова Юлия
руководители: Данилов Лаврентий, Варфоломеева Марина
Протеомные исследования часто проводят с применением пулированных образцов. Пулирование проб - это смешивание биологического материала от разных особей. В результате уровень экспрессии большинства белков в пуле будет равен среднему уровню экспрессии соответствующих белков в отдельных образцах. В результате пулирования увеличивается общее количество биологического материала в пробе, что бывает особенно важно при исследовании мелких организмов. Кроме того, при пулировании увеличивается качество сопоставления пятен белков на разных гелях. Наконец, снижается уровень биологической изменчивости между отдельными пулами, и это, в свою очередь, влияет на мощность статистических тестов. В ходе предполагаемого проекта предлагается оценить как влияет число и размер пулированных проб на мощность статистических тестов при разном уровне биологической и технической изменчивости в анализе дифференциальной экспрессии.

Слайды
Черная кошка в тёмной комнате: поиск новых вирусов и плазмид в метагеномах | Центр Алгоритмической Биотехнологии, СПбГУ

студенты: Калтович Артём, Яковлева Юлия, Сказина Мария, Забелкин Алексей
руководители: Райко Михаил, Антипов Дмитрий
На сегодняшний день в базах данных лежит много собранных метагеномов, которые проанализированы довольно поверхностно. По последним работам стало ясно, что мы очень сильно недооцениваем разнообразие вирусов и плазмид - например, самый распространенный бактериофаг в кишечнике человека был открыт только в 2014 г, а в 2017 было показано, что это на самом деле целая группа родственных вирусов (причем всё это было обнаружено исключительно биоинформатическими методами). В данном проекте мы предлагаем поискать новые вирусы и плазмиды в доступных метагеномах из различных сред с помощью инструментов, разработанных в нашей лаборатории.

Слайды
Динамика разнообразия и обилия симбионтов в метагеноме | НИИ биологии Иркутского государственного университета

студент: Алексеева Лолита

руководитель: Дроздова Полина
Общее описание проекта.
Данные для анализа: около 60 образцов RNA-seq (~30 млн. парных ридов на образец, Illumina 2x100), для каждого образца использован материал
одного целого животного вида Eulimnogammarus verrucosus (Crustacea:
Amphipoda). Около половины образцов соответствуют животным,
содержавшимся в контрольных условиях, а остальные — животным,
подвергнутым влиянию различных стрессоров. Согласно предварительным данным, существенное число чтений принадлежит симбионтам или комменсалам объекта исследования, в первую очередь инфузориями.

Цели проекта: характеристика разнообразия симбионтов в транскриптоме
разных особей и изучение стабильности состава (и количественного
соотношения) симбионтов между разными особями одного вида и при
стрессовых воздействиях.

Слайды
Где в персике спрятался ретротранспозон? | ИОГен РАН

студенты: Пахалко Илья, Гончар Анастасия

руководитель: Поверенная Ирина
Ретротранспозоны - это генетические элементы, которые могут самовоспроизводиться и путешествовать по геному. Хотя они есть в большинстве эукариотических организмов, больше всего их можно найти в геномах растений. Семейство Розоцветные (Rosaceae) включает в себя много ценных плодовых деревьев (яблоко, груша, персик и т.д.), и выведение новых сортов на сегодняшний момент требует большего понимания генетического разнообразия как в отдельных видах, так и во всем семействе. Поскольку каждая миграция ретротранспозона в новое место является эволюционным событием, по их месторасположению в геномах представителей Розоцветных можно будет оценить эволюцию данного семейства.

Слайды
Обработка данных LCMS | Skoltech

студенты: Машкова Ольга, Хамитов Денис, Недильченко Ольга, Синяков Артем

руководитель: Ильин Александр
Есть данные липидомного анализа из исследования по влиянию витамина Д на мышей. Целью проекта является обработка и интерпретация данных.

Слайды
Обмен транспозонами в геномах вагинальных бактерий | ФХМ ФМБА России

студенты: Мазур Ольга, Янушкевич Сергей, Попова Аделия

руководитель: Старикова Елизавета
Вагинальная микробиота представляет собой относительно закрытое микробное сообщество, представленное, как правило, несколькими видами лактобактерий, которые поддерживают кислотную среду, необходимую для нормального функционирования женского организма. Мы предполагаем, что данная экологическая ниша также создаёт благоприятные условия для горизонтального переноса генов, в том числе между лактобактериями и условно-патогенными микроорганизмами. Один из наиболее интересных путей горизонтального переноса генов (например, генов устойчивости к антибиотикам) -- с помощью бактериальных транспозонов.
Цель проекта -- идентифицировать общие транспозоны и переносимые ими гены в геномах различных вагинальных бактерий.

Слайды
Доработка метода LSEA для анализа тканеспецифичности сложных признаков | Институт биоинформатики

студенты: Алексеев Дмитрий, Кутленков Дмитрий

руководитель: Барбитов Юрий
Ранее в Институте биоинформатики был разработан метод LSEA, позволяющий проводить бинарный анализ обогащения наборов генов в данных GWAS. В рамках этого проекта мы хотим переписать код LSEA в более удобоваримый вид и исправить несколько важных проблем, а также применить LSEA для анализа взаимосвязей ткань-фенотип и клеточный-тип-фенотип.

Слайды
Поиск ассоциаций с репродуктивной изоляцией узкочерепной полевки | ЗИН РАН

студент: Сказина Мария

руководители: Петрова Татьяна, Бондарева Ольга
Узкочерепная полевка Lasiopodomys gregalis – широкоареальный вид грызунов. Мы показали, что популяции из Юго-Восточного Забайкалья и Восточной Монголии представляют собой криптичеcкий вид Lasiopodomys raddei. При скрещивании L. raddei и L. gregalis в лаборатории потомства получить не удалось, при том, что контрольные группы внутри своего вида успешно размножались (Petrova et.al. 2016). Мы отсеквенировали транскриптомы для трех особей от каждого вида. Задача – выяснить, связана ли репродуктивная изоляция с какими-то конкретными участками транскриптома.

Слайды
Сравнение репитомов различных видов картофеля (род Solanum sect. Petota) | ФГБНУ ВНИИСБ

студент: Гурина Алёна

руководитель: Дивашук Михаил
Сопоставление повторяющейся ДНК (тандемные повторы и мобильные элементы) у различных видов картофеля. Сиквенсы получены из образцов различного географического происхождения. В задачи проекта входит: 1) изучение уровня изменчивости повторяющейся ДНК ; 2) создание цитогенетических маркеров; 3) поиск закономерностей изменения повторяющейся ДНК.

Слайды
Сравнение репитома Aegilops tauschii различного георграфического происхождения | ФГБНУ ВНИИСБ

студенты: Куреев Николай, Попова Аделия

руководитель: Дивашук Михаил
Сопоставление повторяющейся ДНК (тандемные повторы и мобильные элементы) у Aegilops tauschii предковой формы мягкой пшеницы. Сиквенсы получены из образцов различного географического происхождения. В задачи проекта входит: 1) изучение уровня изменчивости повторяющейся ДНК ; 2) создание цитогенетических маркеров; 3) определение места происхождения вероятного предка мягкой пшеницы; 4) поиск закономерностей изменения повторяющейся ДНК у злаков.

Слайды
Сравнение инструментов для анализа данных секвенирования геномов вирусов гриппа | ФГБУ «НИИ гриппа им. А.А. Смородинцева» Минздрава России

студенты: Ушаков Михаил, Цыба Дарья

руководитель: Артём Фадеев
В ходе проекта предстоит провести сравнение пайплайнов, используемых в различных научных институтах для анализа данных NGS геномов вирусов гриппа (сборка консенсусных последовательностей + поиск SNP).

Слайды
Предсказание аминокислотной последовательности NRP по геномным данным | ЦАБ СПбГУ

студент: Исаев Василий

руководитель: Гуревич Алексей
Нерибосомные пептиды (NRP) -- фармакологически важные природные соединения. Они кодируются в геноме крайне запутанным образом ("нерибосомным кодом"). Например, чтобы описать NRP из всего 10 аминокислот может потребоваться десятки тысяч нуклеотидов в ДНК. Нерибосомный код был впервые описан и частично расшифрован в 1999 году, однако до сих пор программные инструменты предсказывающие аминокислотной последовательности NRP по геномным данным работают неидеально. Результат работы таких программ -- список возможных (предсказанных) аминокислот и некие "скоры" (score), описывающие уверенность программы в своих предсказаниях.

Цель проекта -- разработать новую "скоринг-схему" для предсказаний, которая решит проблемы существующих упрощенных моделей.

Слайды
Разработка адаптивного метода оценки количества фетальной ДНК в плазме крови беременных женщин по данным NGS | ФГБНУ НИИ АГиР им.Д.О.Отта

студенты: Жукова Наталия, Толмачев Михаил

руководитель: Козюлина Полина
На базе Института акушерства, гинекологии и репродуктологии Отта был разработан и введен в клиническую практику неинвазивный пренатальный скрининг анеуплоидий плода по данным секвенирования ДНК из плазмы крови матери (НИПС). Важнейшим этапом данного скринингового теста является точная и правильная оценка уровня фетальной ДНК (то есть ДНК, пришедшей от плода) относительно количества ДНК материнского происхождения.

На точность оценки могут влиять разные факторы, в том числе пол плода и тип консерванта, в который собирали кровь беременной женщины. Для плода мужского пола уровень фетальной фракции определяется достаточно однозначно по количеству чтений, картировавшихся на Y хромосому, однако для плода женского пола существуют лишь косвенные варианты определения фетальной фракции, и точность падает.

Целью данного проекта является сравнить опубликованные методы оценки уровня фетальной ДНК, подходящих для девочек, и на этой основе разработать собственный комплексный алгоритм оценки фетальной фракции, учитывающий основные факторы, такие как пол плода, тип консерванта и тд.

Слайды
Анализ динамики состава симбионтов по данным транскриптома | Helmholtz Centre for Environmental Research - UFZ

студент: Озерова Юлия

руководители: Липаева Полина, Дроздова Полина
Озеро Байкал является уникальным примером разнообразия эндемичной фауны. Литоральная амфипода Eulimnogammarus verrucosus обитает исключительно в водах Байкала. Известно, что внешние покровы E. verrucosus являются местом обитания эпибионтных инфузорий (симбионтов, живущих на поверхности хозяина).

Осенью 2019 года мы наблюдали такое интенсивное обрастание амфипод инфузориями, которое приводило к гибели особей в лабораторных условиях. Было проведено секвенирование транскриптома E. verrucosus, выловленного осенью 2019 года. Предлагается провести анализ симбиотического сообщества E. verrucosus, сравнить полученные данные с предыдущими метатранскриптомными данными (отловы 2013 года, когда такого обрастания не наблюдали, уже обработанные в другом проекте в Институте биоинформатики) и сделать вывод о том, изменился ли состав (качественно или в соотношении) симбиотического сообщества. Также предлагается провести сборку и аннотацию метатранскриптома, полученного в результате секвенирования E. verrucosus.

Слайды
Применения метода Deep Galerkin для решения уравнения диффузии в популяционной генетике | Университет ИТМО

студенты: Панков Викентий, Харламов Владислав

руководитель: Носкова Екатерина
Демографическая история популяций - история развития этих популяций, включающая в себя такие параметры как время разделения, численность популяций, миграции между ними и коэффициенты отбора. Одним из наиболее популярных методов для вывода параметров демографических историй является диффузионное приближение (dadi, Gutenkunst et al. 2009). Этот метод симулирует генетические данные, а именно аллель-частотный спектр, численно решая несколько уравнений диффузии. Предлагается внедрить метод из статьи Deep Galerkin (Sirignano and Spiliopoulos, 2018), позволяющий получать решения PDE с помощью искусственных нейронных сетей, вместо классической численной схемы, реализацованной в пакете dadi. Оценить преимущества и недостатки такого подхода.

Если Deep Galerkin покажет себя значительно быстрее классического подхода, то это позволит значительно более качественно выводить демографические истории. Целью данного проекта является применение и оценка целесообразности метода Deep Galerkin в контексте решения уравнений диффузии в dadi.

Слайды
Анализ геномов устойчивых к антибиотикам бактерий методами машинного обучения | Jetbrains Research

студенты: Веселова Влада, Масликова Татьяна

руководитель: Лукашина Нина
В последние годы активно развивается устойчивость бактерий к воздействию антибиотиков. Это вызывает большие проблемы в лечении бактериальных инфекций и приводит к высокой смертности среди пациентов, в том числе, в г. Санкт-Петербурге.

Цель проекта: с помощью методов машинного обучения выявить генетические факторы, влияющие на развитие антибиотикорезистентности у бактерий Klebsiella pneumonie. Проект использует данные, предоставленные НИИ Детских инфекций.

Слайды
Анализ дифференциальной экспрессии генов методами машинного обучения | Jetbrains Research

студенты: Царев Александр, Чангалиди Антон

руководитель: Лукашина Нина
Глобальная цель проекта заключается в разработке нового подхода к анализу данных экспрессии генов (на примере данных по экспрессии генов в условиях загрязнения различными пластификаторами) и сравнение этого подхода с классическими методами биоинформатики.

Проект проводится в коллаборации с исследователями из университета Уппсалы (Швеция), в том числе, с учеными-биологами.

Слайды
Анализ повторяющихся элементов в геноме S. purpuratus | СПбГУ

студент: Окорокова Лариса

руководитель: Николай Панюшев
Цель проекта - выявить закономерности экспрессии мобильных элементов в эмбриогенезе морского ежа S. Purpuratus. Мы выявим и проаннотируем новые повторы в геноме морского ежа. Обнаруженные новые элементы необходимо будет проаннотировать и выяснить их происхождение. Для каждого из описанных элементов мы определим экспрессию в каждой из стадий эмбриогенеза - 2, 4, 8, 16 бластомеров. Возможно, потом построим корреляции с экспрессией генов.

Слайды
Разработка и расчет структурных дескрипторов для ядерных рецепторов | Университет ИТМО

студенты: Петросян Степан, Мамаева Мария

руководитель: Пац Карина
Данный проект направлен на формирование списка и расчет структурных дескрипторов для последующей проверки их способности предсказывать закономерности в связывании ядерных рецепторов (известных своим аллостерическим поведением) с различными лигандами.

Основная цель - составить список таких дескрипторов (около 40 штук) на основе литературных данных (а также собственных идей), и рассчитать их для структур ядерных рецепторов содержащихся в базе PDB. Дополнительная цель (при наличии времени и соответствующих навыков у студентов) - осуществить кластеризацию полученных результатов и проверить, будут ли структуры, связанные со схожими лигандами, находиться в одном кластере по результатам расчета дескрипторов.

Слайды
Discovery of allosteric binding site in G protein-coupled receptors | Skoltech

студенты: Догонашева Олеся, Мазур Ольга

руководитель: Petr Popov
- To run long-scale molecular dynamics (MD) simulation for the human GPCRs, using 3D structures recently solved by our group.

- To apply binding site detection method in order to investigate cryptic binding sites, e.g. those that open/close during MD trajectory.

- To perform post-processing and statistical analysis of the obtained results.

The projects will be suitable for students who is interested in molecular modelling & structural bioinformatics. Python programming skills are also required.

The projects imply large scale molecular modelling and computationally expensive calculations.

Слайды
Поиск регионов с различным метилированием ДНК на гомологичных хромосомах на основе ридов Oxford Nanopore | University of California, San Diego

студент: Киркилевич Анна

руководители: Проданов Тимофей; Bansal Vikas
Метилирование ДНК регулирует экспрессию генов и играет важную роль в человеческом эпигеноме. Также как и отдельные нуклеотиды, метилирование может отличаться на двух гомолочных хромосомах. В этом проекте мы предлагаем найти такие регионы при помощи длинных ридов технологии Oxford Nanopore.

Секвенаторы Oxford Nanopore различают нуклеотиды, сравнивая электрический заряд при проходе молекулы ДНК через маленькую пору в мембране. Этот же метод позволяет найти модификации нуклеотидов, в том числе метилирование цитозина.

Предлагается написать пайплайн, который принимает на вход BAM файл с выровненными ридами; разбивает их на гаплотипы с помощью вариант коллера (например, Longshot); находит метилирование (например, с помощью Nanopolish), и затем находит статистически значимые различия.

Слайды
Ускорение и рефакторинг rnaQUAST | Центр Алгоритмической Биотехнологии, СПбГУ

студенты: Сметанин Александр, Калтович Артём

руководитель: Пржибельский Андрей
Программа rnaQUAST стала относительно популярной, а опубликованная статья цитируется. Однако, в текущей реализации есть ряд недостатков. Часть функционала можно передать появившимся за это время библиотекам, а ключевые алгоритмы оптимизировать и распараллелить.

Слайды
Сборка de novo и анализ транскриптомов погонофоры Siboglinum fiordicum (Siboglinidae, Annelida) на разных стадиях развития личинок | Московский государственный университет, кафедра зоологии беспозвоночных

студенты: Охтиенко Анастасия, Уразбахтин Шамиль

руководители: Римская-Корсакова Надежда, Лаврентий Данилов, Максим Нестеренко
Аннелиды – центральная группа Lophotrochozoa, характеризующаяся существенным морфологическим разнообразием. Среди аннелид встречаются группы с гомономной сегментацией тела, гетерономной сегментацией и вовсе не сегментированные черви. Современные данные филогеномики показывают, что аннелиды, обладающие ярко выраженной гетерономной сегментацией занимают глубокое положение на древе аннелид, составляя «раннюю радиацию», а также входят в обширную кладу Sedentaria, сестринскую Errantia . Следует ли рассматривать гетерономность как исходную для всех аннелид черту строения и как она сопряжена с гетерономной сегментацией, характерной представителям других крупных групп Bilateria – у линяющих и вторичноротых? Ответы на эти вопросы являются актуальными в рамках фундаментальной проблемы биологии о реконструкции морфологического облика общего предка Bilateria и понимании путей ранней радиации группы.

В ходе проекта будут получены данные о дифференциальной экспресии генов, предположительно участвующих в регуляции сегментации, зибоглинума до и после формирования первой сегментарной септы.

Исполнители проекта будут вовлечены в обсуждение биологической интерпретации результатов анализа со специалистами в области эмбриологии и зоологии беспозвоночных. Результаты транскриптомного анализа будут сравнены с результатами морфологических исследований, анатомии, клеточной динамики в ходе формирования сегментов. Комплексный подход и сочетание современного инструментария нескольких областей биологии позволят получить новые хорошо документированные результаты, которые лягут в основу сравнительного анализа. сегментарного плана между тремя группами билатерально-симметричных животных - Lophotrochozoa, Ecdysozoa, Deuterostomia - что позволит пролить свет на вопрос морфологического облика общего предка Bilateria и пути ранней эволюции группы.

Слайды
Сравнение репитома Aegopodium podagraria различного географического происхождения | ФГБНУ ВНИИСБ

студент: Дерябина Полина

руководитель: Романов Дмитрий
Сопоставление повторяющейся ДНК (тандемные повторы и мобильные элементы) у Aegopodium podagraria. Сиквенсы получены из образцов различного географического происхождения. В задачи проекта входит: 1) изучение уровня изменчивости повторяющейся ДНК ; 2) создание цитогенетических маркеров

Слайды
Homology analysis of T-cell receptor (TCR) sequences recognizing the same and distinct antigens | Skolkovo Institute of Science and Technology

студенты: Недильченко Ольга, Овсянникова Александра

руководитель: Mikhail Shugay
The set of T-cell receptors (TCRs) carried by T-cells of an individual are one of the key determinants of an efficient immune response against foreign pathogens. TCRs also play a major role in detecting self-antigens providing tumor immunosurveillance and are involved in the development of autoimmune disorders.

Recent advances in the field of adaptive immune system studies and corresponding molecular biology/bioinformatic methods allow us to profile the repertoire of TCRs in a given individual that can be related to a certain type of immune response. Due to huge diversity of both TCRs and antigens they recognize, any response towards a foreign or self antigen is realized by a variety of T-cells carrying distinct TCRs. Currently, there is little understanding of how specific TCRs do recognize their cognate antigens and whether two distinct TCRs can target the same antigen.

The goal of current project is to develop an efficient bioinformatics framework for comparative analysis of TCR sequences, that is, a method allowing to infer sets of TCRs that target the same antigen in a given pathology context. A vast knowledgebase of TCR sequences recognizing various antigens (the VDJdb database) and a wealth of structural data on TCR:antigen:MHC (MHC is the molecule that presents antigens to T-cells) complexes available so far can be utilized to define a proper TCR similarity metric. Such metric can be utilized to infer TCR specificity motifs for infectious diseases, cancer and autoimmunity, providing a useful tool for TCR repertoire analysis in health and disease.

Слайды
Оценка разнообразия бактериофагов в метагеномах | ФНКЦ Физико-Химической Медицины

студент: Машкова Ольга

руководитель: Старикова Елизавета
Применение методов метагеномного секвенирования (в том числе секвенирования вирусных метагеномов) делает возможным и аннотацию вирусных последовательностей, многие из которых относятся к так называемой "тёмной микробной материи". Для оценки видового разнообразия бактерий в микробных сообществах обычно используют последовательности гена 16s рРНК. Однако оценка разнообразия вирусов (в т.ч. бактериофагов) затруднена ввиду отсутствия универсальных маркерных генов.

В рамках данного проекта участникам предлагается разработать пайплайн для оценки видового разнообразия бактериофагов в метагеномах с использованием скрытых марковских моделей отдельных вирусных генов.

Слайды
Сборка и аннотация генома грибов рода Microdohium | Университет ИТМО

студенты: Мураева Ольга, Потапенко Евгений

руководитель: Ткаченко Александр
Грибы рода Microdohium вызывают заболевания у ряда видов растений, а в частности "снежную плесень". В данном проекте будет необходимо собрать и проаннотировать при помощи транскриптомных данных геномы нескольких представителей рода.

Слайды
Влияние антибиотиков на суперспирализацию ДНК и экспрессию генов у бактерий | Университет ИТМО

студенты: Долгих Александра, Меженская Дарья

руководитель: Ткаченко Александр
Механизм действия некоторых антибиотиков заключается в нарушении функции гиразы, что приводит к суперспирализации ДНК. В данном проекте будет изучаться, как такие антибиотики влияют на экспрессию генов у бактерий.

Слайды
Механизмы избегания иммунного ответа у ВИЧ | ИБХ РАН

студенты: Алексеева Лолита, Хамитов Денис

руководитель: Цветков Василий
Проект нацелен на изучение свойств вируса иммунодефицита человека и его эволюцию в течение срока инфицирования организма. Было показано, что частицы вируса мутируют с высокой скоростью, изменяя молекулы в своём составе таким образом, чтобы избежать иммунного ответа со стороны организма хозяина. В связи с этим было бы интересно показать на данных глубокого и лонгитюдного секвенирования вирусных частиц у больных СПИД, как изменяются физикохимические характеристики поверхностных белков вирусных частиц. Также можно попробовать натренировать классификатор, который позволил бы предсказывать последствия конкретных мутаций вирусного генома.

Слайды
Поиск генов, ассоциированных с инвазивностью в разных генетических линиях Streptococcus pneumoniae | ФГБУ ДНКЦИБ ФМБА России

студент: Поденкова Ульяна

руководители: Цветкова Ирина, Лихолетова Дарья
Streptococcus pneumoniae является частью нормальной микробиоты верхних дыхательных путей. Пневмококк далеко не всегда вызывает инвазивные заболевания, но его высокая распространенность и хорошая способность к колонизации приводят к миллионам случаев инвазивных заболеваний (пневмония, менингит, сепсис).

Нами был проведен предварительный анализ популяции S. pneumoniae, представленной циркулирующими в России штаммами и повсеместно распространенными генетическими линиями (всего 495 штаммов). Генетические линии были подробно охарактеризованы.

Цель настоящей работы – проанализировать особенности механизмов вирулентности для конкретных генетических линий, на основании сравнения высоковирулентных и низковирулентных штаммов в нескольких датасетах, каждый из которых представлен одним сиквенс-типом по MLST.

Слайды
Сборка генома Ephydra riparia (сем. Ephydridae) и поиск генетических маркеров адаптации эфидрид к экстремальным местообитаниям | МГУ имени М.В. Ломоносова

студент: Яковлева Екатерина

руководители: Марков Александр Владимирович, Ильин Александр
Двукрылые из семейства Ephydridae адаптированы к экстремальным условиям среды, таким как засоленные водоемы, водоёмы с высоким / низким уровнем pH, горячие минерализованные водоемы (в том числе, насыщенные сероводородом), озера сырой нефти и т.д. В 1970-е - 1990-е годы наблюдался интерес к изучению адаптации эфидрид к экстремальным местообитаниям. Исследовались морфологические особенности личинок и процессы осморегуляции. Однако с применением методов молекулярной биологии и геномики вопрос адаптации до настоящего времени не изучался. Отсеквенированы геномы только двух представителей семейства Ephydridae: Ephydra gracilis (https://www.ncbi.nlm.nih.gov/assembly/GCA_00101467...), геном собран на скаффолды, муха обитает в озерах с высокой соленостью в Северной Америке, и Ephydra hians (syn. Cirrula hians) (https://www.ncbi.nlm.nih.gov/assembly/GCA_00101507...), геном собран на скаффолды, она же «щелочная муха», обитает в щелочных озерах в США, Мексике и Канаде.

На кафедре биологической эволюции биологического факультета МГУ отсеквенирован еще один вид из семейства Ephydridae - Ephydra riparia (секвенирование произведено на платформе Illumina, аналогично двум предыдущим видам). E. riparia обитает в Северной Америке и в Европы во временных водоемах, заполняемых морской водой. Отсеквенированные особи были пойманы в соленых лужах на побережье Белого моря.

Цель проекта – осуществить сборку генома Ephydra riparia и сопоставить его с геномами двух других видов эфидрид для выявления генов-кандидатов, предположительно связанных с механизмами, обеспечивающими адаптацию мух к экстремальным экосистемам и их экологическую специализацию.

Слайды
Поиск и описание параллельных инверсий в бактериальных геномах | Institute of Science and Technology (IST Austria)

студенты: Забелкин Алексей, Яковлева Юлия

руководитель: Ольга Бочкарева
Проект посвящен анализу перестроек в бактериальных геномах. В литературе был описан ряд инверсий, переключающих фенотип бактериальной клетки, распространение которых в популяции поддерживается отбором. Все они были выявлены в ходе сравнительного анализа отдельных штаммов, однако системно такие события не изучались, прежде всего из-за отсутствия необходимых биоинформатических инструментов.

Слайды
Поиск иммуносупрессорных генов при car-t терапии | Национальный Медицинский Исследовательский Центр им. В. А. Алмазова

студент: Поздняков Данила

руководитель: Петухов Алексей
В проекте будет выполняться биоинформатический анализ данных NGS после CRISPR/Cas9 SAM скрининга, с целью выявления генов, ответственных за подавление действия car-t клеток при терапии онкологических заболеваний.

Слайды
Поиск и определение характеристик положительного отбора по топологии коалесцентного дерева | ИППИ РАН

студент: Биба Дмитрий

руководители: Базыкин Георгий, Алексеева Евгения
Основная идея проекта - попробовать предсказывать по топологии генеалогического дерева точку на этом дереве, в которой на ген стал действовать положительный отбор, его продолжительность и силу. Нужно подробнее посмотреть, не было ли это уже сделано.

Слайды
Анализ транскриптомных данных нанопорового секвенирования реликтового растения Physcomitrella patens | ИБХ РАН

студент: Глушкевич Анна

руководитель: Князев Андрей
Проект направлен на анализ данных, полученных с помощью нанопорового прямого секвенирования РНК двух жизненных форм мха: протонемы и гаметофор. Планируется установить транскрибируемые участки генома и оценить дифференциальную экспрессию генов на различных стадиях развития Physcomytrella patens. Кроме того, будут выявлены характерные альтернативно-сплайсирующиеся изоформы генов. Важной задачей проекта является установление ранее неаннотированных транскрибируемых участков генома. Использование нанопорового секвенирования позволяет установить модифицированные нуклеотиды в транскриптоме, что впервые будет сделано на мхе в рамках данного проекта. Такой эпитранскриптомный анализ позволит установить закономерности в распределении метилированных участков мРНК и их возможную роль в жизненном цикле реликтового растения.

Слайды