生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

桑基图绘制TCPA蛋白数据库蛋白共表达分析

TCPA蛋白数据库蛋白共表达分析和桑基图绘制
1、蛋白共表达分析
构建模型之后,我们就得到模型蛋白,那么我们希望得到和模型蛋白共表达的蛋白,看看哪些蛋白和模型蛋白是有共表达关系的
输入文件:第一个就是所有蛋白表达文件,这个文件我们对下载的蛋白矩阵整理之后,得到了impute.txt,这个文件包含了所有蛋白的表达

第二个就是构建模型之后,包含模型蛋白的文件,risk.txt这个文件就包含这些信息

做共表达分析筛选条件:cor的绝对值大于0.4,p值小于0.001
相关性检验方法:cor.test()
绘制散点图:plot()

保存相关性表格cor.xls,结果文件包含四列,分别是模型蛋白,与模型蛋白相关的蛋白,cor相关系数,pvalue
相关性散点图,参考线从左往右,斜率大于0,说明蛋白之间是正相关,斜率小于0,说明蛋白之间是负相关

2、桑基图绘制
得到相关性数据cor.txt之后,我们就可以绘制桑基图,这个图现在比较流行,经常在最新发表的文献中看到
桑基图可以对共表达蛋白进行可视化,左边是模型蛋白,右边是跟模型蛋白相关的蛋白,左边蛋白和右边蛋白有连线的话,说明两个蛋白是由相关性的,没有连线的话,说明是没有相关性的,非常直观的展示相关性
输入文件:cor.txt
R包:
install.packages("ggplot2")
install.packages("ggalluvial")
调用R包:
library(ggalluvial)
library(ggplot2)
library(dplyr)
函数:to_lodes_form()
ggplot()

然后绘制图形,就可以得到结果图

精品课程推荐:
TCGA蛋白质数据库挖掘
《中药复方网络药理学联合GEO》
《单细胞测序分析》
《TCGA单基因发文套路挖掘》



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码