Преподаватель: Алексей Сергушичев, Университет ИТМО
В курсе будут рассмотрены основы работы с клиническими данными и данными экспрессии в R. Мы найдем, какие факторы влияют на выживаемость пациентов и посмотрим, какие молекулярные пути могут быть с этим связаны.
Ключевые слова: TCGA, анализ выживаемости, дифференциальная экспрессия.
Необходимое ПО
: R версии 3.5, RStudio
Необходимые пакеты: GenomicDataCommons, magrittr, dplyr, survival, limma, ggplot2, ggrepel, org.Hs.eg.db, reactome.db, fgsea, clusterProfiler, GGally и pheatmap.
*для установки необходимо ввести комманду:
source("
https://bioconductor.org/biocLite.R")
biocLite(c("GenomicDataCommons", "magrittr", "dplyr", "survival", "limma", "ggplot2", "ggrepel", "org.Hs.eg.db", "reactome.db", "fgsea", "clusterProfiler", "pheatmap", "GGally"))
Проект: Анализ молекулярных подтипов рака.
Команде будет необходимо выбрать один из тип раков из базы TCGA и выполнить максимально подробное описание его молекулярных подтипов: какие они бывают, с чем могут быть связаны, как они влияют на выживаемость и т.д.