CEO数据库单基因分析之临床相关性分析
时间:2020-07-26 来源:生信自学网 作者:刘鑫
微信公众号:biowolf_cn 点击:次
临床相关性分析我们找到目标基因之后,我们想看一下我们的目标基因跟哪些临床性状是具有相关性的。下面我们看一下相关性的图形,我们先看一下左边这个图,左边这个图是我们的目标基因和年龄的一个相关性。年龄的话,我们可以分为两组,小于等于65岁的为一组,大于65岁的为另外一组。这里的纵坐标就是我们基因的表达,然后我们可以看到这两组之间他们的基因的表达是具有差异的,因为这个P是小于0.05的,说明小于等于65岁这一组和大于65岁这一组的基因的表达是具有差异的。然后我们从这个图形里面可以看出,这个小于等于65岁的这一组,它的中位值是高于另外一组,就说明我们这个基因在小于等于65岁的这一组里面,它是高表达的,而在大于65岁里面,它是低表达的。接下来我们再看一下我们的基因和T分期之间的一个关系。从这个图里面我们可以看到随着分期的增大,基因的表达是下降的。然后我们在这里可以进行比较,每两两比较,我们都会得到一个P值,所以我们在做这个临床相关性分析的时候,我们的分组不能太多,因为我们这个脚本是每两两之间会进行一个比较,如果是四个组的话,我们就要比较六次;如果是五个组的话,那我们就要比较十次;如果是六个组的话,我们就要比较15次,所以我们的临床分组不要太多。从图中可以看到,这个T1和T2之间,差异不是非常明显,T1和第T3之间差异就非常显著,T1和T4之间差异也是非常显著的。 下面我们来看一下临床相关性分析需要的脚本和输入文件,输入文件的话我们需要得到我们目标基因的表达量,这个在我们之前的文章中已经得到了,就是我们单基因的表达文件singleGeneData.txt,接着我们还需要我们的临床文件clinical.txt文件。最后是我们的生信自学网提供的脚本文件,用来做临床相关性分析,有需要的学员可以关注我们购买相关视频学习。 准备好输入文件后,我们在R中运行我们的脚本文件,等待运行完成,我们就可以得到四个图形文件,这就是临床相关性分析的结果文件。 精品课程推荐: 《GEO基础课程》 《GEO数据库单基因挖掘文章套路》 《GEO数据库单细胞测序》 (责任编辑:伏泽 微信:18520221056) |