TCGA改版下载页面没有PFKM选项,下载STAR-Counts之后如何使用新版merge.pl进行提取 STAR – Counts添加到Cart之后,可以看到数目,这里TCGA-PRAD显示的Files(553),Cases(497), 进入Cart之后,选择下载两个文件一个压缩包,Metadata文件(用来合并)、Manifest文件(用来无法下载压缩包,用gdc工具下载)、Cart压缩包(也就是每个样本一个文件的压缩包),下载好之后,把压缩包解压。 可以看到一个样本一个文件夹,按照之前我们的操作是moveFiles.pl(把文件合并到一个文件夹)、merge.pl(合并矩阵)两步操作,现在用tcga2022新版的merge.pl(需要请联系进行更新或者付费购买,微信客服:18520221056) 然后进入cmd终端,把merge.pl、解压好的553个文件夹、还有下载好Metadata文件放在一个文件夹里面,在cmd终端进入该工作目录,输入命令perl merge.pl metadata.cart.2022-04-03.json 等待运行,接下来会看到normal count:52 tumor count:501,对比改版前数据还是有一点点变化,之前是52 vs 499,当然在实际操作中,如果已经开始做分析,数据是之前下载的,那么在写作中把自己的数据下载时间写清楚,以免浪费太多时间。 运行之后就得到我们经常用到的symbol.txt,那么改版数据提取工作完成,接下来照着课程学习其他内容。 推荐学习最新的课程《肿瘤单基因文章套路(免疫组化+免疫治疗+药物敏感性)》 责任编辑:伏泽 作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载! |