QQ登录

只需一步,快速开始

使用微信账号登录

查看: 298|回复: 2

TCGA数据库ATAC-seq挖掘代码分享

  [复制链接]

该用户从未签到

8

主题

18

帖子

97

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
97
发表于 2019-3-3 12:28:23 | 显示全部楼层 |阅读模式
生信自学课堂
TCGA数据库ATAC-seq挖掘代码分享
--生信自学网光俊
在上个小节里面,生信自学网给大家分享了TCGA数据库ATAC数据可以得到的图表,这小节课,生信自学网带领大家下载数据和画图。
从ATAC-seq数据出发,我们可以绘制各种漂亮的图形,比如染色体覆盖度图、基因组特征图、Upset图、热图、TSS距离分布。除了图形以后,我们可以做ATAC-seq数据Peak的GO和KEGG富集分析,以及motif查找。其次,我们可以将ATAC-seq数据和其他组学进行联合分析,比如和转录组进行联合分析。通过联合分析,我们可以找到调节特定基因的可能的区域。这小节课,生信自学网带领大家分享下数据的下载和画图代码。如果大家不想自己整理数据和脚本,也可以到生信自学网购买。
首先,我们从TCGA官网下载ATAC-seq数据,下载界面如下。我们可以选择红色部分,可以下载raw count,也可以下载normalize count。下载了数据的话,我们就可以得到每个肿瘤的ATAC数据矩阵。
1.    下载好后,我们就可以画覆盖度图了,使用的包是karyoploteR,需要详细介绍,大家可以看看生信自学网的另外一个帖子”线性基因组可视化神来之笔---karyoploteR”。下面我们看看覆盖度的脚本,脚本和脚本得到的图形如下:
2. 染色体特征图绘制,主要包括三种图形:柱状图,饼图,venn饼图,代码和效果图如下:
3.    接下来,我们要看看Upset图,大家可以把他当作venn图,但是如果集合大于5个的时候,venn就不大好用了,这个时候,我们就可以选择Upset图代替venn图了。
4.    接下来,我们看看热图绘制和TSS分布图。
5.    接着,我们看看怎么做GO和KEGG富集分析。
6.    接下来,我们看下怎么得到motif图。
7.    最后,我们可以将ATAC数据和mRNA表格数据进行联合分析,得到联合分析结果,代码和图形如下:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

该用户从未签到

0

主题

1

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2019-3-7 11:34:16 | 显示全部楼层
生信自学课堂
peak.bed在哪里?下载的数据里没有看到
回复 支持 反对

使用道具 举报

该用户从未签到

8

主题

18

帖子

97

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
97
 楼主| 发表于 2019-3-12 19:55:05 | 显示全部楼层
生信自学课堂
聪_aLJEf 发表于 2019-3-7 11:34
peak.bed在哪里?下载的数据里没有看到

可以从下载的文件里面提取的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

客服热线
18520221056(微信) 周一至周日:09:00 - 22:00
公司官网:http://www.biowolf.cn

速科生物是一家融生信创新、设计、技术开发、服务为核心的生物公司,生信自学网专注于生信培训周边课程开发和代码设计,坚持为客户打造高品质的精品课程和培训服务。

Powered by 生信自学网 © 2016-2019 江西速科生物

QQ|生信自学论坛 ( 赣ICP备19001400号-1 )

GMT+8, 2019-3-22 19:03 , Processed in 0.158941 second(s), 26 queries .

快速回复 返回顶部 返回列表