帮助中心

RNA测序-数据筛选

概述

根据数据分析的结果,GCBI提供从差异、疾病和自定义3个方面对基因/转录本进行筛选,详情如下。

差异筛选

 

 

显著性P值

差异的显著性判断,一般认为P<0.05时,差异具有统计性意义。GCBI使用Ballgown方法进行差异分析,它主要是使用一种优化过的多重线性回归方法,其中添加了一个全局项作为优化,这个方法是R语言的limma包中的lmFit方法,它把计算组间平均均值的问题转化为使用一种优化过的多重线性回归,输出最优回归拟合情况下对应的差异倍数。对于没有生物学重复的样本组,使用差异倍数法进行差异分析。

显著性Q值

多重假设检验将p值矫正,矫正后的p值就是q值,可认为是对P值的再判断,Q<0.05是较为理想的结果,表示该基因组间差异结果较为可靠。具体做法是调用R语言的stat包中的p.adjust方法。

差异倍数

通过对基因/转录本在样本中的FPKM值进行标化,然后根据实验组和对照组的设置,进行差异倍数的计算。

备注:对于某些多分组差异分析(样本数-样本组数<2),由于每组只有一个或两个样本,无法进行统计学分析,所以GCBI平台采用两两样本组根据差异倍数进行差异筛选,然后取几组差异基因的并集结果作为总的差异分析结果。

参考文献:

[1] Frazee AC, Pertea G, Jaffe AE, Langmead B, Salzberg SL, Leek JT Ballgown bridges the gap between transcriptome assembly and expression analysis. Nat Biotechnol. 2015 Mar;243-6. pii:nbt.3172. doi:10.1038/nbt.3172.

 

疾病筛选

 

相关疾病

根据DisGeNET数据库中整合的已验证的基因与疾病的关联关系对基因进行筛选,可同时选择多种疾病,筛选疾病相关的基因。

肿瘤相关的信号通路

根据已报道的参与肿瘤发生、转移过程中的20个信号通路,通过对这些信号通路中包含的基因进行计数,用户可以根据关注的信号通路对基因进行筛选。

参考文献:

Bauer-Mehren A., Rautschka M., Sanz F., Furlong L.I.. DisGeNET: a Cytoscape plugin to visualize, integrate, search and analyze gene-disease networks. Bioinformatics . 2010; 26:2924–2926.

Piñero J., Queralt-Rosinach N., Bravo A., Deu-Pons J., Bauer-Mehren A., Baron M., Sanz F., Furlong L.I.. DisGeNET: a discovery platform for the dynamical exploration of human diseases and their genes. Database . 2015; bav028.

Janet Piñero  Àlex Bravo  Núria Queralt-Rosinach  Alba Gutiérrez-Sacristán Jordi Deu-Pons  Emilio Centeno  Javier García-García  Ferran Sanz  Laura I. Furlong, DisGeNET: a comprehensive platform integrating information on human disease-associated genes and variants.Nucleic Acids Res. 2017; 45 (D1): D833-D839

自定义筛选

 

 

关注的基因/转录本

根据用户关注的基因或转录本进行筛选,可同时输入多个基因/转录本。

基因属性分类

根据基因的属性进行分类统计,用户可以根据关注的类型进行筛选,共提供以下几种数量类型的统计

基因功能分类

根据COSMIC数据库中基因在疾病中的作用,分为癌基因和抑癌基因,根据Transfac数据库记录的转录因子基因,然后对基因进行筛选。

本文由 GCBI学院 作者:其明技术专家 发表,转载请注明来源!

热评文章

发表评论