数据分析

芯片Meta分析,菜鸟进阶第一步

Meta分析作为发文章的一种捷径, 虽然显得有些功利,但在缺乏时间开展新的实验或是没有能力开展大规模的临床实验时不失为一种好方法。
 
创新从模仿开始,今天我们以一篇meta分析文章为例,来看看表达谱meta分析的基本思路
 
Meta分析
那meta分析是啥呢?
Meta分析作为系统评价的一种,简单来说是一种定量合成的统计学方法,其是对具有相同研究目的多个独立研究结果进行系统的、定量的统计学分析与综合评价的一种研究方法,是对文献资料的再分析。
 
通过 Meta分析可以达到以下目的: 
  1. 提高统计检验效能; 
  2. 评价结果一致性,解决单个研究间的矛盾;
  3. 回答一些尚无确切答案或有多种不同解释的问题;
  4. .改进对作用效应的估计
分析案例
Hepatocellular carcinoma associated microRNA expression signature: integrated bioinformatics analysis, experimental validation and clinical significance
相关疾病:肝癌                                   样本数1250对              Meta分析方法:RRA                            IF:5.008
  
高通量miRNA研究中会因平台的不同样本量小等问题而导致结果的不一致性。 
这篇文章作者收集了26个已发表的miRNA文章数据,通过Meta分析以期找出与肝癌相关、可作为临床诊断生物标志物的miRNA
ps:miRNA,microRNA的简称,一类由内源基因编码的长度约为22 个核苷酸的非编码单链RNA 分子,可调控基因的表达。已验证一些特殊的miRNA参与癌症的进程。
那作者具体是如何做的呢?
1.收集与甄别文献
作者首先在GEO,web of science,ArrayExpress数据库中查找13年12月31日前有关肝癌miRNA表达谱数据相关的文章,并筛选出实验设计为人的癌和癌旁组织样本的原始文献作为后续分析。作者最终筛选出了26篇文献,总样本量达到1250对,26个样本芯片数据具体信息如下:
2.数据构建
在进行数据处理之前,作者首先根据miRbase21版将各个样本的miRNA进行了统一命名。
先将差异miRNA(p值<0.05)根据fold change和p值进行排序,随后将排序标准化。在标准化的排序中,每一个miRNA被赋予一个a值,a为0.5表示在样本中不存在,大于0.5表示上调,小于0.5表示下调。 
各样本中miRNA情况如下:
                                                                                                             图1 26个数据样本miRNA分布统计
3.Meta分析差异miRNA
作者采用RRA来进行统计分析差异miRNA。RRA(Robust rank aggregation)是一个R语言工具包,可以用来比较排过序的基因列表,其用p值衡量每个item自身的排序与随机排序相比的优势,并用p值进行重新排序。RRA特别适合实验平台不一致的情况。作者最终筛选出了5个上调的miRNA8个下调的miRNA,其存在于1/3的数据集中。筛选出的差异miRNA在样本中的分布如下:
                                                                                                          图2 筛选出的差异miRNA在样本中的分布
                                                                                                                           图3差异miRNA qPCR结果
4.验证
作者随后用qPCR验证了这13个miRNA的表达,其中9个与分析结果一致。并通过数据库TCGA分析了这些miRNA与肿瘤分级的关系,最后用生存分析筛选得到了能预测临床效果的miR-21。
                                                                                                                              图4 TCGA验证结果

图5 生存分析

5.靶基因及功能分析
通过Meta分析筛选出肝癌相关的差异miRNA后,随后就是常规的miRNA研究思路,对差异miRNA进行靶基因预测及功能分析,进一步探究这些miRNA潜在的功能。
                                                                                                            图6 miRNA靶基因pathway富集分析
作者最后筛选得到了11个潜在的肝癌miRNA生物标志。
 
表达谱Meta分析思路
从上述案例我们可以归纳出表达谱Meta分析的大概思路,和一般表达谱研究的区别主要在于数据的收集及整合分析。
数据收集
可以通过数据库找到相应的样本数据信息,推荐的网站有:
GCBI  https://www.gcbi.com.cn/gclib/html/index
GEO   https://www.ncbi.nlm.nih.gov/geo/
ArrayExpress  http://www.ebi.ac.uk/arrayexpress/
Meta分析
根据合并指标选择合适的meta分析方法,如combine p-value,combine effect size,combine rank及direct merge。
常用的meta分析软件有Stata、Rev man 、MetaDE、 MAMA。
 
Meta分析应用场景
那我们什么时候可以用meta分析呢?
以下场景都可以用meta分析:
  1. 病因学和危险因素研究;  
  2. 治疗手段的有效性研究;
  3. 诊断方法评价;
  4. 预后估计;
  5. 病人费用和效益分析等
Meta分析注意点
1、文献需做到查准查全。Meta分析是基于文献的再分析,所以最后能否得到准确及可信的结论关键在于文献的查全率和查准率,并且需要有严格的文献筛选和质量评价,控制发表偏倚及偏倚
 
2、在数据集的纳入的时候,除了研究思路,还需涉及到纳入数据的质检,最好考虑统一平台同一类型的芯片。
 
3、需对纳入数据进行预处理,如原始数据的背景校正,标准化(统一基因名,表达量)等。
 
4、要选择恰当的统计学分析方法,注意同质性检验,保证合并分析的可比性和分析结果的可靠性。
 
知识拓展
三点搞定数据上传GEO
差异基因分析及结果解读
GO和pathway分析及结果解读  视频教程
如何用GASE做富集图
用path-net挑选核心pathway   视频教程
趋势分析及结果解读
共表达网络分析及结果解读
miRNA与mRNA网络调控结果解读
miRNA靶基因预测视频教程
(2)

本文由 GCBI学院 作者:乞嘚咙咚呛咚呛 发表,转载请注明来源!

热评文章

发表评论