生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

胃癌患者临床数据整理

胃癌患者临床数据整理

        我们前面下载好了临床数据,下载好了临床数据以后,我们是每个样品一个文件,而且它的文件格式还是xml文件。这样的文件可读性很差,我们就需要对这样的数据进行了整理。
       通过整理,我们可以得到如下一个矩阵


       这个矩阵它的行名是样品的名称,列名是各种临床数据,下面我们看一下这些临床数据。这里第一列就是样品的名称,然后接下来就是生存时间,它的单位是天,所以我们要把它转化为年,然后接下来就是生存状态,0就代表这个病人还活着,然后1就代表这个病人已经死亡,这就是生存状态,再接下来就是这个病人的年龄,性别,分级,分期。这就是我们提取的临床信息,当然每个肿瘤的临床信息都不同,所以这里的话我们只能把这些常见的临床信息提取出来,这些临床信息也是文章里面用的最多的一些临床信息。

        接下来我们来提取这下临床信息,我们要准备是输入文件是我们下载好的临床数据压缩包,我们先解压我们下载好的数据,解压后里面的文件内容都很大,所以我们需要用我们事先准备好的脚本文件从里面提取出我们需要的信息。




我们先要将脚本文件拷贝到解压后的文件夹中,然后用perl运行我们的脚本文件,等待运行完成,我们就得到了整理之后的临床信息文件,就可以做后续的分析了。


视频购买链接:
《免疫基因对文章套路视频》

精品课程推荐:
《GEO数据库miRNA芯片挖掘》
《甲基化肿瘤分型文章套路视频》
《TCGA肿瘤免疫细胞浸润模式挖掘》
(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码