基因富集分析


基因富集分析,非常常用,但我们真的弄清楚了嘛?

除了最常用的 GO enrichment (BP/CC/MF) / KEGG,对于基因的 enrichment,还有 GSEA 和 Reactome pathway analysis

另外一点,gene enrichment 的对象,常常是,differentially expressed genes (DEGs),然而,思路可以打开,可以做其他的有意义的 gene set,如 AS gene set (例如这篇:Nature, 2023, RBFOX2 modulates a metastatic signature o)。

tools

online webpage tools

DAVID

Enrichr

g:Profiler

R package

gprofier2

使用 evcodes=T 选项,输出 intersection genes,False by default.

gprofiler/gprofiler2 的输出 term 常常有很多包含关系,所以,可以对结果进行去重

  1. 根据显著性排序,包含的 intersection genes 完全相同的 term,保留最显著的一条 term;
  2. 所有的 intersection genes 合并成一个 pool,制作一个矩阵,rownames 为 term_name,colnames 为 gene_id,
    根据 gene 在 term 中的有无(有为 1,无为 0)填充矩阵,绘制 heatmap,肉眼观察互相包含的 term,筛选
  3. 2 中,绘制 heatmap,可先 cluster_rows = F, merge 连 term_name 都相似的 term,然后再 cluster_rows = F, 观察其他的。

cytoscape

clueGO

GSEA

process of enrichment analysis result

manually curated GO terms

“collapsed GO terms into 10 generalized functions”, learning from Pancreatic microexons regulate islet function and glucose homeostasis (2023, Nat Met)

可视化方法

基因功能网络图

SCI 图表复现:基因功能网络图


文章作者: 梁绍波
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 梁绍波 !
评论
  目录