TCPA蛋白数据库蛋白共表达分析和桑基图绘制 1、蛋白共表达分析 构建模型之后,我们就得到模型蛋白,那么我们希望得到和模型蛋白共表达的蛋白,看看哪些蛋白和模型蛋白是有共表达关系的 输入文件:第一个就是所有蛋白表达文件,这个文件我们对下载的蛋白矩阵整理之后,得到了impute.txt,这个文件包含了所有蛋白的表达 第二个就是构建模型之后,包含模型蛋白的文件,risk.txt这个文件就包含这些信息 做共表达分析筛选条件:cor的绝对值大于0.4,p值小于0.001 相关性检验方法:cor.test() 绘制散点图:plot() 保存相关性表格cor.xls,结果文件包含四列,分别是模型蛋白,与模型蛋白相关的蛋白,cor相关系数,pvalue 相关性散点图,参考线从左往右,斜率大于0,说明蛋白之间是正相关,斜率小于0,说明蛋白之间是负相关 2、桑基图绘制 得到相关性数据cor.txt之后,我们就可以绘制桑基图,这个图现在比较流行,经常在最新发表的文献中看到 桑基图可以对共表达蛋白进行可视化,左边是模型蛋白,右边是跟模型蛋白相关的蛋白,左边蛋白和右边蛋白有连线的话,说明两个蛋白是由相关性的,没有连线的话,说明是没有相关性的,非常直观的展示相关性 输入文件:cor.txt R包: install.packages("ggplot2") install.packages("ggalluvial") 调用R包: library(ggalluvial) library(ggplot2) library(dplyr) 函数:to_lodes_form() ggplot() 然后绘制图形,就可以得到结果图 精品课程推荐: 《TCGA蛋白质数据库挖掘》 《中药复方网络药理学联合GEO》 《单细胞测序分析》 《TCGA单基因发文套路挖掘》 责任编辑:伏泽 作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载! |