基因富集分析,非常常用,但我们真的弄清楚了嘛?
除了最常用的 GO enrichment (BP/CC/MF) / KEGG,对于基因的 enrichment,还有 GSEA 和 Reactome pathway analysis。
另外一点,gene enrichment 的对象,常常是,differentially expressed genes (DEGs),然而,思路可以打开,可以做其他的有意义的 gene set,如 AS gene set (例如这篇:Nature, 2023, RBFOX2 modulates a metastatic signature o)。
tools
online webpage tools
DAVID
Enrichr
g:Profiler
R package
gprofier2
使用 evcodes=T
选项,输出 intersection genes,False by default.
gprofiler/gprofiler2
的输出 term 常常有很多包含关系,所以,可以对结果进行去重
- 根据显著性排序,包含的 intersection genes 完全相同的 term,保留最显著的一条 term;
- 所有的 intersection genes 合并成一个 pool,制作一个矩阵,rownames 为 term_name,colnames 为 gene_id,
根据 gene 在 term 中的有无(有为 1,无为 0)填充矩阵,绘制 heatmap,肉眼观察互相包含的 term,筛选 - 2 中,绘制 heatmap,可先
cluster_rows = F
, merge 连 term_name 都相似的 term,然后再cluster_rows = F
, 观察其他的。
cytoscape
clueGO
GSEA
process of enrichment analysis result
manually curated GO terms
“collapsed GO terms into 10 generalized functions”, learning from Pancreatic microexons regulate islet function and glucose homeostasis (2023, Nat Met)