生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

用命令行下载TCGA癌症数据

TCGA是什么,这里就不介绍了,大家自行检索吧。它的数据下载分为两种:1.网页下载(数据量大时不稳定),2.命令行下载(方便大数据下载)。
现在要讲的就是命令行下载。

1.打开TCGA主页,点开Launch Data Portal
2.1.选GDC Apps---Data Transfer Tool---下载后解压,存到你想存的文件夹里
2.2解压后文件名叫gdc client.exe
3.1.点data,进去页面,点左边的case,选择pancreas(学习的例子是以胰腺癌为例)
3.2 点case旁边的file,然后勾选选项。我就不说为什么选这些选项了,这些都是根据自己的需要来选,现在勾选的这些是用来举例子的。选完之后点中间蓝绿色的键,Add all files to the cart,于是cart(购物车)里就有182个文件了。

3.3点右上角的cart进入这个页面,点download,就会出来manifest和cart。点击manifest,直接下载,与gdc client.exe放在同一目录下面。

4.两种方法:1,点“开始”,在对话框输入cmd,2.或者按windows键+R。进入DOS。
5.1.将存有gdc client.exe和manifest文件文档的地址复制,先输入cd,再把地址粘贴进入DOS对话框。如果不是C盘,记得先写D:或者E:回车,再输入cd,粘贴地址。

5.2刚才说我C盘里的gdc client.exe是木马,不让我运行,我换D盘试试,也不行,最后发现是安了三六零,把它卸载之后应该可以了。现在gdc client.exe和manifest文件是存在D盘一个叫gdc的文件夹里。

命令是这样的

D:\gdc>gdc-client.exe download -m gdc_manifest_20161213_015958.txt

然后点回车,注意gdc client一定要有后缀名exe,manifest文件一定要有后缀名txt。可以复制文件名后按Tab键,后缀就出来了。

简单来说就是D:\gdc>加gdc client文件名+gdc client后缀+download+空格+-m+manifest文件名+manifest文件的后缀+回车

然后就下载好了,所有的文件会在D盘的gdc里。
(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码