博客

数据库挖掘,你只知道GEO和TCGA就out了!

公开的数据库是一个宝藏,大家喜欢从挖掘数据库,要么从中寻找思路和研究的分子,要么直接发表文章,关于TCGA和GEO这两个数据库,大家已经知道了。

当然,除了GEO和TCGA外,这种公开的数据库还有很多,GEO收录的信息包括了RNA表达、SNP、甲基化、蛋白结合以及蛋白表达等的数据,TCGA更偏重于从肿瘤方向研究RNA和蛋白表达、拷贝数突变、预后等结果。今天我们就来介绍另外一个数据库:ProteomeXchange。

顾名思义,这是一个蛋白质组学的数据库,在蛋白质组学如此火的今天,很多课题组把蛋白质组学实验的结果上传到PX,这就形成了另外一个宝藏。

ProteomeXchange的网址:http://www.proteomexchange.org/,打开后主页是这样的:

同样的,我们既可以查看数据,又可以提交数据:

大家想必对查看数据最感兴趣,单击Access Data后新打开的界面:

我们可以看到首先展示的是收录的物种、关键词和仪器,下面就是搜索框,我们就可以进行搜索了,我们输入肺癌lung cancer进行搜索:

下面是搜索到的结果:

我们看到登录号为PXD004077的这个数据:

我们看一下这个数据的介绍:

作者通过iTRAQ的方法对肺腺癌和癌旁样本中的蛋白进行了相对定量,并基于信号通路和network分析、THPA数据库(我们介绍过的:(工具篇)S5E50:航母级神器——蛋白组学结果大收录!)、文献搜索和创新性找到了6个差异表达的新蛋白并用于免疫组化和WB验证。另外,对两个表现最好的分子ERO1L和NARS进一步进行了临床和生物意义的分析。

这是文章中的结果:

接着我们看PXD004077这组数据的下载链接:

这里有两个下载链接,一个是FTP位置,另外一个是PRIDE项目的网址,FTP位置的数据是这样的:

PRIDE项目的网址打开后,

接下来就是下载和重分析数据了,这里给出的原始数据raw data:

我们下次找机会再介绍。

(3)

关键词:

热评文章

评论:

3 条评论,访客:3 条,博主:0 条
  1. peck82
    peck82发布于: 

    为什么网页打不开?

    • li8592496
      li8592496发布于: 

      可以打开啊

  2. herb888
    herb888发布于: 

    不错不错

发表评论