数据分析

共表达网络分析教程

分子生物网络展现了分子之间的相互作用,可较为深入地反映基因间的表达调控关系,在组学机理的研究中尤为重要。今天我们首先来看看共表达网络分析。
共表达网络分析
基因共表达网络分析(Gene Co-expression Network Analysis)是基于基因间表达数据的相似性而构建的网络图,图中的节点代表基因,具有相似表达谱的基因被连接起来形成网络。
                                                                                                                                   图1 共表达网络图
共表达网络的建设从概念上来讲是简单直观的,通过基因表达的相似性可分析基因产物可能的相互作用关系,从而了解基因间相互作用脉络及寻找核心基因。核心基因是重要的枢纽,在网络模块中器关键性作用。
案例分析
下面以文献为例,来看看如何用共表达网络分析找出关键的节点基因。
文献信息
Genes related to the very early stage of ConA-induced fulminant hepatitis: a gene-chip-based study in a mouse model
相关基因:ACSL1MPDZ       相关疾病: Liver Failure 
样本:GSE17184       PMID: 20398290             IF:3.867
这篇文章主要研究爆发性肝炎在早期阶段的病理机制,作者在寻找病变过程中起主导作用的基因群及关键基因时,采用ConA 诱导的小鼠肝炎模型,选取了0h,1h,3h,6h四个时间点做表达谱分析。用ANOVA筛选得到了1473个差异表达基因(p<0.05,FDR<0.05)(差异结果解读)。为进一步筛选出显著变化的基因群,作者将差异基因进行趋势分析,从中得到了10个显著变化的趋势模型(p<0.05)并将最显著变化的NO.9和NO.16趋势模型中的基因进行共表达网络分析,来判断哪些基因在爆发性肝炎早期阶段起主导作用。
在以k-core值分的子网络中(k-core值越大表明子网络越处于核心的地位),作者筛选得到了k-core值最高为11的子网络中的26个核心基因。26个核心基因主要参与蛋白转运、转录调节、细胞代谢等方面。筛选出的核心基因为爆发性肝癌的早期诊断提供了分子依据。
                                                                                                                               图2 共表达网络
                                                                                                                       表1 部分核心基因属性列表
共表达网络分析结果解读
如何从共表达网络图中挑选出关键基因?如何看各个参数呢?
在得到的共表达网络图中,可根据基因的网络特征值,即网络中各基因的位置函数计算出该基因在网络中的关系强度。特征值最高的基因处于网络的枢纽地位,起关键性的作用。
共表达网络图
如上图中共表达网络图,圆圈代表基因,直线代表基因存在的调控关系。圆圈的大小代表degree值,即网络中某一基因与周围基因的关系数量,degree越大,代表与它有相互作用关系的基因越多。圆圈的颜色就是按照k-core进行划分的聚类结果。k-core表示在一个子图中,所有的点至少连接着k个点,其用以评估基因在网络位置的中心程度,值越大表示degree越大且越中心。相同大小的k-core体现的是基因之间的相似性及功能相关性。图中k-core最高为11的灰色基因就是处于核心地位的基因群。 图中每个基因与相邻基因的密度用聚类系数(clustering coefficient)来表示。聚类系数值越大,表明这个基因邻近基因间的调控关系很复杂,处于的区域对于网络具有更重要的价值。
共表达网络表基因属性列表
在基因属性类表中,主要看degree值大小和ishub。degree越大,代表与它有相互作用关系的基因越多。Ishub判断是否是核心基因。
基因关系列表
基因关系列表列举了每两个基因的相关关系,主要看相关系数和相关关系。相关系数(correlation coefficient)代表两个基因间表达谱的相似程度,值越高表明相似性越高。相关关系(relationship)表明两个基因表达是正相关还是负相关。
总结
首先用相关系数来判断基因表达之间的相关性,设定阈值筛选一定的基因做网络分析。在网络结果图中,可用一些特征值来衡量基因或基因群是否处于核心地位,如degree值,k-core值等。
共表达网络分析步骤
在共表达网络分析中,可用R软件包进行WGCNA(权重共表达网络分析),生成节点和边的纯文本文件,将边的纯文本文件导入到Cytoscape软件中(网络可视化工具)即可得到相互作用网络。看到R软件包,不自觉向后退三步。
有没有简单的方法呢?GCBI平台算法直接加载好了模块,即点即用。后台分析方法像啥无标度网络(Scale Free Network)检验,动态分支截断(Dynamic Branch Cut)方法以及基于二元查找方法的基因关系展示等等你都可以不用理会。
小编用上述文献中的样本数据GSE17184实例操作一下。
1、 进入GCBI网站的在线实验室
https://www.gcbi.com.cn(注册即可免费使用)
2、 建立趋势分析方案
小编建立了如下共表达网络分析方案。(方案建立步骤详见往期)
3、获取样本在GCBI样本库中直接搜索GSE17184直接搜文献也可获得数据链接,将数据发送至实验室以供后续分析。
根据样本信息在每个时间点选择对应的实验样本。
4、设置各模块参数差异分析   p值<0.05 Q值<0.05(因多分组,不考虑fold change)
趋势分析   p值<0.05
显著性趋势功能分析(STC-GO)
生物过程   p值<0.01,FDR<0.01
网络分析   基因共表达分析
5、运行方案
14分钟即分析完成,结果如下:
拓展
检测工具
Affymetrix GeneChips Mouse 430 2.0 Arrays(文章使用)
Clariom™ D assays, mouse(曾用名GeneChip® Mouse Transcriptome Assay 1.0)(推荐) 
知识拓展
三点搞定GEO数据上传
差异基因结果解读
GO和pathway分析及结果解读   视频教程
如何用path-net挑选核心pathway  视频教程
趋势分析及结果解读
(3)

本文由 GCBI学院 作者:乞嘚咙咚呛咚呛 发表,转载请注明来源!

热评文章

评论:

2 条评论,访客:2 条,博主:0 条
  1. peck82
    peck82发布于: 

    相关系数,和节点。最重要

  2. 蝴蝶梦ssn
    蝴蝶梦ssn发布于: 

    怎么建立分析方案?

发表评论