转录组数据id转换以及临床数据的下载和整理
1、转录数据的id转换
通过前面数据的整理我们得到一个行名为id,列名为样品名的矩阵,接下需要为这个矩阵进行转换,得到
一个行名为基因的名称,列名为样品名的矩阵。需要用到symbol脚本,human配置文件,mRNAmatrix矩阵。
运行命令行即可得到id转换后的矩阵。
2、临床数据的下载
之后我们进行临床数据的下载
进入网页TCGA GDChttps://portal.gdc.cancer.gov/
清空购物车,进入下载界面
点击下载的疾病类型,项目等,根据自己的需求进行筛选
之后点击file进行临床数据的选择,最后添加到购物车里进行下载
在购物车中点击cart就可以进行下载,由于文件较小因此可以不用下载Manifest文件,
下载完后解压就行了
3、临床数据的整理
接下来进行临床数据的整理,需要用到临床数据和getClinical脚本文件,通过命令
行进行提取后就可以得到最终文件
购买课程《肿瘤突变负荷联合免疫细胞浸润文章套路视频(TMB预后模型)》
精品课程推荐:
《泛癌多基因-基因家族文章套路》
《泛癌单基因文章套路》
《中药复方网络药理学》
《WGCNA四分文章套路》
《RNA结合蛋白RBP文章套路》
(责任编辑:伏泽 微信:18520221056)
|