生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

TCGA数据库可变剪切数据挖掘简介

可变剪切(alternative splicing,AS),也叫做选择性剪切,指的是再mRAN前体到成熟mRNA的过程当中,不同的剪切方式使得同一个基因可以产生多个不同的成熟mRNA,最终产生不同的蛋白质。

可变剪切是调节基因表达和产生蛋白质多样性的重要机制,是导致真核生物基因和蛋白质数据较大差异的重要原因。
可变剪切再肿瘤中经常发生,与肿瘤发生发展密切相关。研究发现可变剪切影响了那些在肿瘤中经常发生突变的蛋白基因家族,改变了肿瘤相关信号通路中的蛋白-蛋白相互作用,说明可变剪切也是驱动肿瘤发生的一种重要原因。

可变剪切事件
七个可变剪切事件
1、可变受体位点(AA):3'端是可变的
2、可变供体位点(AD):供体端是可变的
3、可变启动子(AP):
4、可变终止子(AT):
5、外显子跳跃(ES):最常见的可变剪切形式,
6、外显子互斥(ME):
7、内含子保留(RI):

可以根据可变剪切时间构建模型
7个可变剪切分别构建模型,7个一起构建模型,总共可以构建八个模型

可变剪切PSI值
PSI(Percent-spliced-in,拼接百分比)可以针对isoform,exon,ASE进行计算,对于ASE来说,PSI=splice_in/(splice_in+splice_out),在RNA-seq数据中splice_in和splice_out分别是支持splice_in和splice_out发生的reads的数目。

剪接因子
SF(剪接因子,splicing factor)参与RNA前体剪切过程的蛋白质因子。根据其功能作用,可以分为核小核糖核蛋白颗粒(snRNP)蛋白因子和非snRNP蛋白因子。
剪接因子表达异常导致基因的可变剪切发生改变,在肿瘤中,剪接因子表达异常可能会引起特定促癌剪切异构体的形成,从而导致癌症的发生。

生信自学网推荐精品课程:
《GETx数据库联合TCGA解决癌旁样本少》
《单基因挖掘套路基于TCGA数据库》
《m6A RNA甲基化挖掘基于TCGA》
《中药复方网络药理学》

(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码