Meta分析作为发文章的一种捷径, 虽然显得有些功利,但在缺乏时间开展新的实验或是没有能力开展大规模的临床实验时不失为一种好方法。
创新从模仿开始,今天我们以一篇meta分析文章为例,来看看表达谱meta分析的基本思路。
Meta分析作为系统评价的一种,简单来说是一种定量合成的统计学方法,其是对具有相同研究目的的多个独立研究结果进行系统的、定量的统计学分析与综合评价的一种研究方法,是对文献资料的再分析。
-
-
-
-
Hepatocellular carcinoma associated microRNA expression signature: integrated bioinformatics analysis, experimental validation and clinical significance
相关疾病:肝癌 样本数:1250对 Meta分析方法:RRA IF:5.008
高通量miRNA研究中会因平台的不同及样本量小等问题而导致结果的不一致性。
这篇文章作者收集了26个已发表的miRNA文章数据,通过Meta分析以期找出与肝癌相关、可作为临床诊断生物标志物的miRNA。
ps:miRNA,microRNA的简称,一类由内源基因编码的长度约为22 个核苷酸的非编码单链RNA 分子,可调控基因的表达。已验证一些特殊的miRNA参与癌症的进程。
作者首先在GEO,web of science,ArrayExpress数据库中查找13年12月31日前有关肝癌miRNA表达谱数据相关的文章,并筛选出实验设计为人的癌和癌旁组织样本的原始文献作为后续分析。作者最终筛选出了26篇文献,总样本量达到1250对,26个样本芯片数据具体信息如下:
在进行数据处理之前,作者首先根据miRbase21版将各个样本的miRNA进行了统一命名。
先将差异miRNA(p值<0.05)根据fold change和p值进行排序,随后将排序标准化。在标准化的排序中,每一个miRNA被赋予一个a值,a为0.5表示在样本中不存在,大于0.5表示上调,小于0.5表示下调。
作者采用RRA来进行统计分析差异miRNA。RRA(Robust rank aggregation)是一个R语言工具包,可以用来比较排过序的基因列表,其用p值衡量每个item自身的排序与随机排序相比的优势,并用p值进行重新排序。RRA特别适合实验平台不一致的情况。作者最终筛选出了5个上调的miRNA及8个下调的miRNA,其存在于1/3的数据集中。筛选出的差异miRNA在样本中的分布如下:
作者随后用qPCR验证了这13个miRNA的表达,其中9个与分析结果一致。并通过数据库TCGA分析了这些miRNA与肿瘤分级的关系,最后用生存分析筛选得到了能预测临床效果的miR-21。
图4 TCGA验证结果
图5 生存分析
通过Meta分析筛选出肝癌相关的差异miRNA后,随后就是常规的miRNA研究思路,对差异miRNA进行靶基因预测及功能分析,进一步探究这些miRNA潜在的功能。
作者最后筛选得到了11个潜在的肝癌miRNA生物标志。
从上述案例我们可以归纳出表达谱Meta分析的大概思路,和一般表达谱研究的区别主要在于数据的收集及整合分析。
可以通过数据库找到相应的样本数据信息,推荐的网站有:
GCBI https://www.gcbi.com.cn/gclib/html/index
GEO https://www.ncbi.nlm.nih.gov/geo/
ArrayExpress http://www.ebi.ac.uk/arrayexpress/
根据合并指标选择合适的meta分析方法,如combine p-value,combine effect size,combine rank及direct merge。
常用的meta分析软件有Stata、Rev man 、MetaDE、 MAMA。
1、文献需做到查准和查全。Meta分析是基于文献的再分析,所以最后能否得到准确及可信的结论关键在于文献的查全率和查准率,并且需要有严格的文献筛选和质量评价,控制发表偏倚及偏倚。
2、在数据集的纳入的时候,除了研究思路,还需涉及到纳入数据的质检,最好考虑统一平台同一类型的芯片。
3、需对纳入数据进行预处理,如原始数据的背景校正,标准化(统一基因名,表达量)等。
4、要选择恰当的统计学分析方法,注意同质性检验,保证合并分析的可比性和分析结果的可靠性。
本文由 GCBI学院 作者:其明技术专家 发表,转载请注明来源!