博客

玩下这个小软件?说不定能玩出文章、课题哦

https://cancergenome.nih.gov/

有些临床小伙伴可能还不知道TCGA(The Cancer Genome Atlas )数据库,他是NIH旗下一个含有众多基因表达和生存预后关系的数据库网站,为什么重要,简单点说,只要能把他上面的数据搞下来分析下,零成本,就能帮我们憋出好多科研思路,对文章课题极其有利,这也是最近几年它越来越火的原因。

但虽然大家都知道TCGA数据库重要,但很多刚入门小伙伴就是搞不灵清怎么下载他的数据,更何况,TCGA改版后数据下载看起来不是那么好下了,上一期我们分享过TCGA的几种在线的下载方式,但是实在是愧对大家。

因为小编自己也几乎不用那些下载方式,为什么呢,那些方法太麻烦了,同时很多在线工具的弊端都是下不全(作者往往都不会更新了)!

于是乎:

生信人团队就只能自己开发了,然后“生信人1号”(TCGA数据下载神器)就这样诞生了,不大共7M,下载即用免安装!……

我们相信,即使你是生信的零基础小白,你也可以把这个软件玩得很好哦

利用这个软件,你可以:

1.“点点点”即可获得TCGA数据(都不用去那个网站)

2.不需要学习任何R语言就可以下到最全的数据。(因为这个软件就是根据严谨的R语言算法设计的)

3.利用这个小软件,设计课题

4.利用这个小软件,写文章(这2项技能我们会后续实例讲解,请密切关注更新)

5.如果你还是有很多问题或想法,那可以点击“阅读原文”到生信人软件专区去和大家一起交流吧

先上软件截图:

 

软件的功能简介如下(手机的话就将就放大看吧,相信你下载数据肯定是用电脑的):

从功能简介上可以看出软件支持TCGA新版所有数据(有下载权限的)下载,然后还提供临床随访信息提取(就是那个Clinical解析按钮啦);

大家都知道新版数据中把原来的GeneSymbol换成ENSG了,有时候感觉好不方便啊,还是GeneSymbol看起来比较舒服一些,这个软件也提供了转换的功能(就是那个ENSG_ID转换按钮啦);

该软件考虑到菜鸟和老鸟的使用感受,原汁原味的从TCGA下载数据保存起来,以便老鸟自己基于这些原始数据进行处理,对于菜鸟则可以使用软件提供的简单的数据功能将这些数据转换成表格形式(就是那个合并文件按钮啦)。

软件使用及其简单,一眼就会,推荐一个快速上手的步骤:

首先左侧双击想要下载的癌型,等待右侧检索提示(这里得保证你电脑能够上TCGA, 毕竟软件只是帮你冲TCGA获取数据;当然你浏览器挂了VPN能上TCGA,软件也上不了。。。),等检索完右侧检索中就会出现该癌症类型下的所有可以下载的数据类型及样本量,这时你点击下载选择数据保存的目录(Tips:一个数据类型单独放一个目录,重复下载除外);等待下载完毕。然后使用合并按钮进行数据合并,这样多个样本就能合并成一个表格了。然后如果你要转换ENSG ID就选择转换按钮,如果你下载的数临床数据要解析成表格就选择Clinical解析。大概的步骤是这样,不要奇怪三个按钮的顺序为啥是从右到左的,我猜作者可能是个左撇子

重点提示:

1、  这个软件支持***断点续传***,怎么传:假如网速慢共有三百个样本,只下载了100个,没时间等了,没事!!!你大可以关掉,下次下载时你只要选择上一次同样的下载目录,软件会根据已下载的文件来判断和继续下载未下载的。

2、  这个软件360是报毒的,所以你要使用得添加信任,至于为什么会报毒,问过360了,交钱给360买证书,这是一个简洁的不能再简洁的软件,所以大家方便用用就好。

3、  别忘了看菜单栏,随时查阅更新TCGA相关教程

 

Tips:写了这么多,最后发现没有下载地址,好吧。。。。。感觉放哪都不方便,还是去咱们QQ群里下载吧,没加群的扫码进群,位置不多了,速度!!!

热评文章

发表评论