作者:赵文静
GSEA是一个可下载后免费使用的全基因组表达谱芯片数据分析工具。它根据已有的对基因的定位、性质、功能、生物学意义等知识的基础上,首先构建了一个分子标签数据库,数据库中包含了多个功能基因集。通过分析一组处于两个生物学状态的基因表达谱杂交数据,它们在特定的功能基因集中的表达状况,以及这种表达状况是否存在某种统计学显著性。
1.进行GSEA分析,首先需要在本地安装GSEA软件,并且安装JAVA。
1)第一是差异基因的数据文件(txt格式),第一列是基因名称,后面是样本的信号值,如下图:
2)第二个文件是样本的分组信息文件,”phenotype.cls”文件,格式如下:
3.打开安装好的GSEA的软件,第一步,点击 load data, 导入我们准备好的上述两个文件。
第三步,填充右侧栏中的参数,一共分三块,第一块如下图
Expression dataset选择你导入的差异的数据;
Gene sets database 选择网络的KEGG的数据库
Number of permutations 默认值1000,不用修改;
Phenotype lables 即你导入的分组文件,选择T vs N,即实验vs对照组
Collapse dataset to geng symbols 选择false
Permutation type 选择gene_set
Min Size:exclude smaller sets 设置为3,即表示参与该通路的基因少于3个时,则不列入结果中。
红色框里的参数需要修改,其余参数默认,设置完成后点击Run,左边会显示运行状态;
运行完成后,左侧会显示成功,然后在你命名的路径中,查看结果即可。
本文由 GCBI学院 作者:其明技术专家 发表,转载请注明来源!