26高通量测序-设计矩阵

设计矩阵

​ 在第2部分中,我们最后说左边不是t检验的标准设计矩阵。右边是t-test的标准设计矩阵,它对应的是一个稍微不同的方程。

image-20210108164755189.png

​ 让我们专注于这个新的设计矩阵和公式是关于什么的!在这个矩阵中,第1列所有的数据(control和mutant)都变成了(mean(control)),但只有mutant的值变成difference(mutant - control)。举个例子:第一行中的1表示“开”control的均值,第一行中的0表示“关”mutant-control的差。

image-20210108173544739.png

两个方程的残差是相同的。方程也有相同数量的参数,2,所以p(fit)是相同的,所以F值相同,所以p值也相同。如果它们做同样的事得到同样的p值,为什么右边的更常见?说实话,我不知道确切的答案,但我认为这与回归有关

image-20210108173824952.png

​ 到目前为止,我们已经在使用1和0的背景下研究了设计矩阵,等式“开”或“关”。让我们退后一步,记住它是如何工作的。第一列中的数字乘以control的均值,第一列中的数字乘以mutant-control的差。第一行中的1表示“开”control的均值,第一行中的0表示“关”mutant-control的差。当我们有不同类别的数据时,一个满是1和0的设计矩阵非常适合做t检验或方差分析——但我们可以使用其他数字。

​ 例如,这是一个线性回归的设计矩阵,第一列有一堆1,在第二列,我们得到了每个点的x轴位置。我们现在看第一行,它对应着图中的点。就像之前一样,第一列的数乘以公式的第一项。在本例中,将y-intercept乘以1将其‘打开’。就像之前一样,第二列的数乘以公式的第二项。在这种情况下,我们对斜率(slope)进行缩放(*0.9)。

image-20210109104851310.png

为了让它更具体,我们来看看用实数表示y轴截距和斜率会发生什么。y-intercept=0.01,slope=0.08。y=10.01+0.90.8=0.73,.然后在最小二乘拟合线上得到一个点对应于第一个数据点。

image-20210109105255893.png

​ 重复以上步骤,得到所有数据点在拟合曲线上的对应点,我们可以计算残差和p值。这个例子表明,设计矩阵并不总是一串0和1,而是可以是我们想要代入方程的任意一组数字,每次一行。因为这种风格的设计矩阵(第一列都是1)更常见,所以这里的所有例子都将遵循这种格式。

image-20210109105642819.png

​ 我们回到了老鼠体重和老鼠大小之间的关系。然而,现在我们有两种老鼠,红色测量数据来自正常的对照小鼠,绿色测量数据来自突变小鼠。我们可以看到突变小鼠往往更大,即使它们的重量相同。换句话说,突变小鼠似乎遵循了绿色虚线趋势,而对照组的老鼠似乎也遵循了红色虚线趋势。

image-20210109110131734.png

​ 我们可以用统计学来检验两种类型的小鼠之间是否有显著的差异吗?如果我们做一个回归,我们会得到一条好看的线,但它不会告诉我们突变小鼠是否明显大于正常小鼠。

image-20210109110236406.png

​ 另一方面,一个正常的t检验会忽略体重和大小之间的关系,只对老鼠的大小进行统计,p值>0.05,两组老鼠的大小并没有差异。

image-20210109110902950.png

​ 由于小鼠的体重(weight)和大小(size)之间的这个关系与小鼠的类型有关,所以我们需要将它们结合到单个test中,换句话说,我们不是比较老鼠大小的平均值,我们要去比较两条线之间的关系。为了做到这一点,我们需要一个方程,其中包含正常小鼠的y轴截距项,一项表示i突变的小鼠与对照小鼠的差值,最后一项关于斜率(在这个例子中,这对两种老鼠斜率相同)。这意味着我们需要一个第一列为1的设计矩阵,这意味着两条直线与y轴相交于某一点。第二列表示差值是开启还是关闭,control mouse的mutant offset为“off”,mutant mouse的mutant offset为”on"。第三列是体重数据。让我们看设计矩阵的第一行,代入数字,的到红线上的点。

image-20210109112149512.png

​ 代入设计矩阵中的所有数据,我们有了直线上的位置,我们就可以计算残差。现在我们把这个左边复杂的模型叫做“fancy model”与右边简单的模型“simple model”进行比较。代入这个复杂模型的残差平方和进入F值计算的公式,此时p(fancy)=3,代入简单模型的残差平方和,p(simple)=1,F=21.88,p值=0.003。

image-20210109113650256.png

​ 上面的简单模型只考虑了大小,现在我们即考虑大小有考虑体重,但是忽略老鼠的种类。然后我们计算残差,代入计算F=32.6,p值0.0023。这个小的p值表明,同时使用体重和老鼠种类比单独使用体重能更好地预测老鼠的大小。

image-20210109113601299.png

这是一个简单的模型,忽略了老鼠体重。计算残差,计算F=31.06,p值=0.0025,这个小的p值表明,同时使用体重和老鼠种类比单独使用种类能更好地预测老鼠的大小。

image-20210109114600937.png

批次效应(batch effect)

​ Lab A为一个实验,Lab B重复它,但是测量结果全部变小了。我们希望结合这两个数据集,看看突变体是否与控制组不同,但我们需要进行消除“批次效应”

​ 首先,第一项为Lab A Control的平均值,第二项为Lab B Control与Lab A Control的平均值的差值,第三项为mutant和control数据的差值。得出设计矩阵,本质上,我们想知道方程的最后一项是否重要?或者,最后一列重要吗?

image-20210109115717060.png

​ 现在我们比较这个复杂方程(fancy equation)与简单方程(simpler equation,简单方程忽略了control与mutant的分组)的区别,一个小的p值将告诉我们,保留control与mutant的分组的方程比不保留control与mutant的分组方程更好地预测基因表达。这将意味着control与mutant之间的差异是显著的。

image-20210109120058568.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,258评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,335评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,225评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,126评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,140评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,098评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,018评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,857评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,298评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,518评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,678评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,400评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,993评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,638评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,801评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,661评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,558评论 2 352

推荐阅读更多精彩内容