基础科研

大数据下的肿瘤基因突变和表达特异性

作者:成东林

肿瘤是一种由DNA变异不断累积而导致细胞发生不受控激增并形成新生物的遗传疾病。肿瘤基因组学是基因组学中的一门子学科,它主要通过高通量测序技术来将特定基因和肿瘤关联起来。肿瘤基因组学的主要目的是通过鉴定新的原癌基因或者抑癌基因来为肿瘤诊断,肿瘤临床结果预测和肿瘤靶标治疗提供新的方法。诸如伊马替尼、曲妥珠单抗和安维汀等的肿瘤靶标治疗的成功为肿瘤基因组学在阐述新的肿瘤治疗靶点上提供希望。
COSMIC
COSMIC-- Catalogue of Somatic Mutations in Cancer数据库收录和整理了多个维度的肿瘤基因信息,包括单核苷酸多态性、插入缺失、拷贝数变异、表观遗传甲基化、基因表达情况等,对应的在COSMIC数据库可以查询研究相关疾病的各个维度的综合信息,极度丰富在肿瘤基因组学研究上的应用。
COSMIC数据库应用
1、寻找不同肿瘤不同器官中特异性基因群
在大数据前提下,COSMIC数据库中可以方便的获取各种肿瘤在SNP、CNV、基因表达、基因甲基化特异性的基因群,下图展示了乳腺癌前20个基因的多维度谱,其中PIK3CA、TP53、MED12表现出普遍性的点突变,LTBP2以则展示出其高甲基化能力,而其它基因则表现出拷贝数扩增和基因高表达。
2、查询特定基因在特定肿瘤中的变化情况
利用研究最多的100个基因,基于全局基因调控关系,构建基因间上下游调控网络,得到核心基因MAPK1。MAPK1在肿瘤中的特定突变和表达情况到底是什么样的?
在COSMIC数据库中查询该基因,即可在大样本检测的前体下显示出在不同组织类型的肿瘤中突变、拷贝数、表达和甲基化情况,如下图:
MAPK1在不同肿瘤中按突变频率从高到低依次为:宫颈癌、皮肤癌、大肠癌、子宫内膜癌、胃癌等,如果你也关注MAPK1的突变,这样的突变频率是否与你的研究吻合?
3、细胞实验中细胞系的选取
结合1 & 2,设定MAPK1在乳腺癌中表达研究场景,假定在我们的研究中MAPK1低表达,则需要构建过表达MAKP1细胞系模型,应该选择什么样的细胞系来进行实验?COSMIC数据库提供成百上千细胞系基因表达谱,可以方便的查询特定基因在特定细胞系中表达的高低。如下图,MAPK1低表达的各种细胞系,选择乳腺癌相关细胞系进行实验。
(1)

本文由 GCBI学院 作者:Lina 发表,转载请注明来源!

热评文章

发表评论