2021-12-28

Science | 泛基因组分析优化结构变异识别

原创 图灵基因 图灵基因 2021-12-28 07:03

收录于话题#前沿生物大数据分析

Giraffe,由加州大学(UC)Santa Cruz分校基因组学研究所的科学家开发的一种新的制图算法,可以有效地将单个测序读数映射到代表数千个人类基因组的泛基因组参考,其速度与当前将测序数据映射到单个参考基因组的标准方法相当。


流行且廉价的短读DNA测序会产生个体的基因组序列片段,这些片段必须映射到参考基因组序列,以确定其染色体位置,并识别其中与参考不同并可能影响健康的变化。完全依赖单个线性参考序列来识别基因多样的人类亚群中的遗传变异不可避免地会引入偏差——即错误地绘制与参考基因组不同的序列的倾向。


Giraffe是一种泛基因组短读映射器,可以有效地将测序数据映射到序列图中的单倍型集合,它的使用提供了一种实用的解决方案,可以消除偏见并进行更好的基因组分析。一个单一的参考基因组选择代表一个遗传变异的一个版本,而不代表其他版本。通过使更具广泛代表性的泛基因组参考文献实用化,Giraffe可以使基因组学更具包容性。使用数学图来表示不同序列之间的关系,可以将不同的基因组组合成具有代表性的泛基因组参考。


在近期发表在《Science》杂志上的一篇论文中(“Pangenomics enables genotyping of known structural variants in 5202 diverse genomes”),作者评估了Giraffe的效率,并表明它能够更全面地描述遗传变异,在生物医学研究和精确临床实践中,需求日益增加。



加州大学Santa Cruz分校生物分子工程副教授、基因组学研究所副所长、论文通讯作者Benedict Paten博士说,“我们多年来一直在努力实现这一目标,现在我们第一次找到了比单一参考基因组更快、更好的实用方法。基因组学对生物医学的未来非常重要,它能平等地帮助每一个人,因此我们需要能够解释人类群体多样性且不存在偏见的工具。”



尽管人类基因组序列在所有人类中几乎99%相同,但在代码的单个字母(单核苷酸变体,SNV)、短片段的添加(插入)或遗漏(删除)方面存在分散的差异,统称为“indels”,以及更大、更复杂的结构变化,包括重新排列五十个或更多的代码字母。人类基因组中约0.001%的这些不同类型的变化不仅解释了我们独特的外表,还可能解释健康和疾病之间的差异。



使用单一参考基因组很难找到结构变异,但它们在某些疾病中起着重要作用。普通人拥有数百万个SNV和indels以及数万个较大的结构变异,但结构变异影响基因组的比例比SNV和indels加在一起还要大。



“基因组学的主力是SNV和短indels,因为结构变异已经被隐藏起来。”研究人员说,“泛基因组学正在使结构变异变得可见,这样我们就可以像研究SNV和短indels一样对其进行研究。有很多结构变异,它们会产生很大的影响,因此这对疾病遗传研究的未来至关重要。”



在这项新的研究中,在这项新的研究中,研究人员利用公开的基因组数据构建了两张人类基因组参考图,以评估新工具Giraffe。基因组学研究所的研究科学家、该研究的共同第一作者Jouni Sirén博士开创了Giraffe的许多关键算法创新。评估表明,Giraffe可以准确地将新的序列数据映射到一个泛基因组参考中的数千个基因组,就像现有工具映射到一个参考基因组一样快,同时减少了映射偏差。



“不仅分析效果更好,而且速度也和目前使用线性参考基因组的方法一样快。”基因组学研究所的博士后研究员、该论文的共同第一作者Jean Monlong博士说。



研究人员利用Giraffe绘制了来自5202人的不同群体的序列读数,并确定了他们最近发现的167000个结构变异的基因型。他们估计了这些结构变异的不同版本在整个人群和亚群中的频率。作者表明,某些变异的频率在不同亚群之间存在很大差异,如果只对一个祖先的个体进行分析,可能会被误解。



研究人员发现,与使用针对单个参考基因组的比对相比,Google Health的深度学习变异调用程序(DeepVariant)可以使用Giraffe对泛基因组的比对更准确地识别SNV和indels。



“最近通过长读测序发现了许多结构变异。”研究人员说,“通过泛基因组,我们可以在短读测序的大型数据集中寻找这些结构变异。这是令人兴奋的,因为这将使我们能够在许多人中研究这些新的结构变异,并就其功能影响、与疾病的关联或在进化中的作用提出问题。”


与加州大学Santa Cruz分校基因组学研究所的其他人一起,Paten目前正在研究由国家人类基因组研究所资助的全面人类泛基因组参考。研究人员预计明年将向科学界提供这一资源。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352

推荐阅读更多精彩内容