一文掌握基因功能(GO)和信号通路(Pathway)分析
下面小编以一篇文章为例,来看看如何缩小差异基因范围,使目标基因挑选更有针对性。
相关疾病 : Carcinoma, Non-Small-Cell Lung; Lung Neoplasms
PMID: 20802022 影响因子 3.622
文章作者使用Affymetrix U133plus2.0芯片检测了台湾地区非吸烟肺癌女性患者60对癌症和癌旁肺组织样本,利用配对T检验筛选了肿瘤组织中687个差异表达基因,并利用逆转录PCR和免疫组化进行了验证。
如何将687个差异基因缩小范围呢?我们需要判断差异基因在肺癌细胞中主要富集在哪些功能类群和代谢通路。文章作者利用IPA(Ingenuity Pathway Analysis)软件对差异基因进行了功能分析,筛选出了16条显著性代谢通路。在最显著的三条通路中,其中两条都和轴突导向信号通路(axon guidance)相关,作者很意外,于是选择了轴突导向信号通路,并在其中挑选了差异表达倍数最高的SEMA5A基因作为后续的研究对象。
作者最后利用kaplan-Meier生存分析证明了SEMA5A基因的低表达和非吸烟女性肺癌的低生存率有关联,其可能成为非小细胞肺癌预后的一个有效的生物标志物,也可能代表台湾地区病人的性别特异性。
归纳一下作者的整体思路,先找差异基因,并通过功能分析进一步缩小差异基因的范围,再从中有针对性的挑选基因。
在差异基因的功能分析中,主要有GO功能分析和pathway分析,上面案例作者主要用了pathway分析。
GO是Gene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述,即对基因产物进行了简单注释。通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。
Pathway指代谢通路,对差异基因进行pathway分析,可以了解实验条件下显著改变的代谢通路,在机制研究中显得尤为重要。
GO分析好比是将基因分门别类放入一个个功能类群,而pathway则是将基因一个个具体放到代谢网络中的指定位置。
利用上述案例中的数据GSE19804 在GCBI在线实验室首先进行差异分析(|fold change|>2, P值<0.001 Q值<0.05),得到了2202个差异基因。将差异基因分别进行GO(P值<0.01,FDR<0.01)和pathway分析(P值<0.05),富集得到351个GO term和110条Pathway。结果如下图所示,表一和表二分别为部分GO富集结果和最显著的15条pathway分析结果。
结果怎么看呢?表头的各个参数解释如下,其中,重点看三个指标, enrichment score、p值和FDR。Pathway分析主要看P值和FDR值,两者越小越好。GO分析还可看Enrichment Score,数值越大表示某个GO term越容易受到实验因素的影响。
GO和Pathway分析结果中都得到了文章中选定的Axon Guidance这个结果(红框)。
将Axon Guidance通路中的所有差异表达基因全部挑选出来,列表如下。作者在文中挑选了显著性最高的SEMA5A作为后续的研究对象。在我们的分析中,当p值小于10^-6时默认为0,按照表达倍数排列SEMA5A也排在前列,和作者的结果较吻合。
目前有许多GO和pathway分析软件,GO分析软件有Avadis (商业软件)、BiNGO(开源java)、DAVID(基于web的工具)等,pathway分析有IPA和MetaCore(商业软件)等。但这些软件学习成本高,且许多都是商业软件。有没有一种分析方法无门槛,直接上手就可以搞定的呢?
GCBI平台, 伸手党的福音,生信分析方法直接加载了模块,你需要做的只是创建方案,拖动模块,单击运行即可。用样本GSE19804演示一下,倒数10min,GO富集分析,pathway分析全搞定。
在方案界面,拖动模块,修改名字和参数,并用连接线将模块连接成一个方案,小编建立了如下差异分析和GO和pathway分析方案。
样本数据GSE19804 直接来自于GCBI样本库,将样本发送到在线实验室。点击方案中样本模块,在样本分组管理中选择配对样本,配对好相应的对照组和实验组样。Lung normal **N为对照组,Lung cancer **T为实验组。
差异分析 |fold change|>1.2 P值<0.05 , Q值<0.05
GO分析 分析类型 生物功能分析 p值<0.01 ,FDR<0.01
点击运行,分析好后点击查看结果或下载结果即可。是不是毫无压力?
本文由 GCBI学院 作者:其明技术专家 发表,转载请注明来源!