基础科研

如何做出你想要的富集分析图

作者:赵文静

GSEA是一个可下载后免费使用的全基因组表达谱芯片数据分析工具。它根据已有的对基因的定位、性质、功能、生物学意义等知识的基础上,首先构建了一个分子标签数据库,数据库中包含了多个功能基因集。通过分析一组处于两个生物学状态的基因表达谱杂交数据,它们在特定的功能基因集中的表达状况,以及这种表达状况是否存在某种统计学显著性。

1.进行GSEA分析,首先需要在本地安装GSEA软件,并且安装JAVA。
http://www.broadinstitute.org/gsea/index.jsp

2.进行GSEA分析,首先需要准备2个文件,
1)第一是差异基因的数据文件(txt格式),第一列是基因名称,后面是样本的信号值,如下图:
2)第二个文件是样本的分组信息文件,”phenotype.cls”文件,格式如下:
3.打开安装好的GSEA的软件,第一步,点击 load data, 导入我们准备好的上述两个文件。
第二步,点击左侧的Run analysis
第三步,填充右侧栏中的参数,一共分三块,第一块如下图
Expression dataset选择你导入的差异的数据;
Gene sets database 选择网络的KEGG的数据库
Number of permutations 默认值1000,不用修改;
Phenotype lables 即你导入的分组文件,选择T vs N,即实验vs对照组
Collapse dataset to geng symbols 选择false
Permutation type 选择gene_set
第二块参数设置如下:
Min Size:exclude smaller sets 设置为3,即表示参与该通路的基因少于3个时,则不列入结果中。
第三块的参数设置如下:
红色框里的参数需要修改,其余参数默认,设置完成后点击Run,左边会显示运行状态;
运行完成后,左侧会显示成功,然后在你命名的路径中,查看结果即可。
下图是结果样式
(1)

本文由 GCBI学院 作者:Lina 发表,转载请注明来源!

热评文章

发表评论