简要内容
--拟时序分析的定义
--结果解读
--------做出结果(cluster、state)
--------确定起始点
--------做start····end的图(并且映射到tsne中又一个图)
--------热图和感兴趣的-单个基因的动力学变化趋势图
--做拟时序分析的适合的情况
--------细胞图谱
--------case control的特征转变
--------重编程或转变轨迹
--文章实例
--------little tips(遇到三叉口的拟时序分析两种方法)
首先做细胞注释(在project中有了,不再赘述)
一、拟时序分析是什么
通过构建细胞间变化轨迹预测细胞随时间的变化
模拟时间的细胞序列的分析
时序中细胞发生的变化
也不一定非要设置不同的时间段去做实验
细胞本身存在拟时序变化,细胞是有变化的,才可以做拟时序分析
二、结果解读
主成分一和二,根据高可变基因进行排序,
每个点是一个细胞
左图按cluster排序,线就是进化轨迹
交点1、2,是有节点的(说明基因有表达量的差异)
右上按state排序,每个分叉一个state,一个表达模式
cluster:得到拟时序分析结果,将cluster映射到结果中
state:根据结果把每个分叉点做命名(表达模式不同),如下
计算机没法判断起始点,要通过生物学意义(基因表达和功能)去确定起始点,
法一:比如一个case,一个control(对照组),一部分枝杈上case的细胞数多(control少),一部分的枝杈上control的细胞数多(case少),那么起点就是control,细胞由control向case转化
法二:判断每个state或cluster中什么功能的细胞多,比如乃鹦鹉的到激活型的,,,,某个state中乃鹦鹉的细胞数目多,而另一个state中激活型的细胞数目多,则乃鹦鹉的那个state为起始点
判断起始点后,做下面这张图
这图与上面的那个cluster映射的图一样的形状,但是下面这个图时根据外面认为的确定一个起始点,颜色越黑的是起始点,越黄,随时间越靠后,然后将这个时间顺序映射到tsne中去,黑色的细胞不断往浅色的细胞转换,
时间顺序得到之后,接下来可以做热图和动力学变化趋势图
热图
热图最左边到最右边就是从起始点到后面的这个动力变化过程中基因的表达量(基因变化趋势)变化(最右边那一列是基因名),左边那一列是将所有的基因分为了三块(三种表达模式),绿色、澄色、蓝色,比如绿色的表达模式,那些高可变基因的表达量逐渐减少(表达量多少的图是右边的那个标签,红色最多,蓝色最少),澄色的部分的表达量也是随着时间的流逝,细胞转化过程中,逐渐减少。蓝色的部分是逐渐增多。
还可以针对感兴趣的某个基因做单个基因在里面的变化趋势
这个图中纵坐标代表表达量,图中每个点代表每个细胞,基因在这些细胞中的表达量
左上的基因趋势不变后来升高,
右上的基因先降低后升高(代表橙色部分)
左下基因一直下降(代表绿色部分)
右下基因一直升高(有可能对应热图中的蓝色部分)
三、文章中如何应用
1做细胞图谱(无组别)
比如细胞有两个亚型A 和 B,两者之间存在一个转变关系,那我们就去做一个拟时序分析,
2、control组的细胞往case组细胞特征转变
两个组别,研究药物处理或其他处理,导致表达谱发生了变化,一种细胞类型去做拟时序分析,否则无意义
3、某一个细胞类型下面的重编程或转变轨迹
比如T细胞的CD4的乃鹦鹉的细胞往TH的转变
比如CD8的乃鹦鹉T细胞往CTL毒性方面的转变
或者干细胞的重编程,人为的特定指定干细胞往哪个方向转变
这些方面都比较适合做拟时序分析
四、例子文章
1、文章一
首先看以下这个图
这个图中都是导管细胞,做完拟时序分析后,左边的为正常的导管细胞,恶化的导管都是右边的,所以人为的指定左边的正常导管细胞为起始点,判断从左往后的肿瘤变化轨迹,然后得到了热图
左边正常,右边恶化,分为P5和P6两种模式,P5的基因表达量都升高,P6的基因先升高后面有点降低
这两个图是一个图
得到了逐渐升高的基因,就可以去做这些基因的功能分析了(可以挑一些基因去做,也可以差异基因去做)
2、文章二
类似于重编程
分为早期、中边、晚期
最右下角的那个图是单个基因的动态变化趋势,看逐渐升高还是降低,
3、文章三
细胞图谱的
A中颜色深的是起始点,浅的是终点
为什么下面不是终点,上面是终点?因为上面的线段长(时间长)
c中表示从start到end的基因的变化趋势
遇到这种三角的图(三岔口的拟时序分析)有两种处理方式
1、直接描绘start---end的变化趋势,像本文中的c
2、因为分支比较明显,可以研究这两者之间的差异
红黄这两种变化之间的差异
比如这篇重编程的文章
下面这条是sucessful 代表干细胞的重编程功能是成功的,得到成功的成纤维,上面那条是重编程失败的细胞的变化趋势,然后绘制热图
这种图是以中间为开始,左边为失败的,右边为成功的,
上面的几个基因就是在失败的模式中表达量很高的,下面的基因在成功的模式中表达量是很高的