如何在遗传病SV中“万里挑一”

作者:大行山
审稿:童蒙
编辑:angelica

引言

三代测序技术的发展,为人类基因组结构变异检测带来了新机遇,是时候借助三代技术这股春风,发掘遗传病里的潜在致病因子——基因组结构变异。

三代基因组重测序轻轻松松鉴定到一万多个基因组结构变异,哪个才应该是你最关注的的致病结构变异,你get到了吗?来,小编教你!

一、遗传病里的暗物质

在过去的几十多年里,特别是高通量技术的出现,人类遗传病编码区域的致病性突变位点被逐步揭开了神秘面纱,但是当前罕见病的诊断率依然不足50%,有很多罕见病依然无法通过当前的短读长测序平台找到致病位点。

主要原因可能是当前的短读长测序平台对单碱基突变位点的检测比较敏感,对于大片段或者复杂的重复区域的结构变异检测可能力不从心,但是这些结构变异可能在遗传病里扮演了重要角色。

二、结构变异那些事

结构变异(structure variants,SV),一般指基因组中大于50bp的大片段变异,主要包括插入(Insertion,IN)、缺失(Deletion,DEL)、重复(Duplication,DUP)、倒位(Inversion,INV)、易位(Translocation,TRA)等。虽然短读长的高通量测序也能检测这些类型的SV,但是由于其读长有限,对大片段的SV检测能力有限,而且假阳性率也比较高,所以,关于遗传病的SV研究并不多见。

三、三代测序助力SV检测

近几年,三代测序技术的快速发展,为遗传病的诊断带来了新的机遇。三代测序以其长读长、无偏向性等优势对大片段的结构变异检测有更好的检出率,同时对一些复杂的SV也能够很好的检测出来,例如串联重复,复合杂合SV。

上图展示了三代测序在复杂SV的检测效力。a 作者基于三代测序鉴定到17号染色体上的ERBB2基因的一小部分大量扩增、断裂,与8号染色体发生基因融合[2],b使用三代测序鉴定到的串联重复序列[3]。

四、一瞥三代人重测序鉴定的SV

就目前已经发表的文章而言,使用三代测序检测的SV数目可谓惊人,一般都能超过一万个。例如在carney综合征研究中得到了13792个DEL和INS类型SV,在进行性阵挛性癫痫病中检测到了17165个INS和DEL类型的SV。

在实际项目里,DEL和INS类型的SV同样占主要部分,如下图,SV总数约2万个,其中INS和DEL类型的SV数目最多,占比接近95%。

如何从这么多的SV里面万里挑一,找到致病SV,成为当前疾病研究者最关注的问题。

五、遗传病SV万里挑一

01 实验设计

在最初实验设计或者样本筛选上,尽可能地考虑周全,除对先证者进行三代人重测序外,尽可能同时包含其父母和同胞兄妹,这样比较容易全面的找到致病变异,如果条件有限,可以参考下面的倒金字塔进行样本选择。

如图,遗传病致病SV检测的实验设计,优先级从下到上,依次降低。

02 初步过滤

既然是筛选致病的SV,首先肯定是保留患病样本特有的SV。这里就需要根据实验设计的几种情况进行分别处理。

第一种情况,如果既有先证者,又有其父母和表型正常的兄妹样本:这种情况下,如果这种疾病没有报道的话,我们需要首先判别遗传模式,根据相应的遗传模式进行筛选。如果该病有报道,可以参考已经报道的遗传模式进行筛选,这里正常的兄妹样本可以进一步去除背景SV,缩小致病SV的范围。

第二种情况,如果有先证者和其父母样本:同样根据遗传模式进行过滤。

如果是第三种情况,只有先证者,没有正常对照:操作起来比较麻烦,但是也可以退而求其次,选择发表的数据作为对照,例如Carney综合征研究中就使用了NA12878标准品结果做为正常样本进行过滤[4]。经过这一步过滤,一般能够过滤掉70%的SV,SV数目由5位数变为了4位数。

03 功能基因过滤

考虑到遗传病的发生主要由基因来介导,所以接下来要保留与基因相关的SV,这里主要指与基因位置有重叠的SV。例如在进行性肌阵挛性癫痫研究中,经过基因过滤,SV数目由4453变为了1981,SV数目进一步下降。如图为实际研究中SV经过对照和基因过滤后的SV数目统计。

04 外显子过滤

接下来进一步缩小范围,我们知道基因是由编码区和非编码区构成的(如图),而真正行使生物学功能的是转录翻译为蛋白的外显子区域,所以我们保留与基因的外显子区域有重叠的SV,如果想更细致的话,也可以考虑只保留编码蛋白功能的CDS区域,通常情况下经过这步过滤就只剩下几十个候选SV了。

05 数据库过滤

百里者,半九十。截至到上一步,虽然我们已经从上万个SV筛选得到了几十个SV,前面这些步骤都可以使用程序批量完成。但是,这些都是候选SV,我们的目标是找到致病的SV,接下来才是最重要最耗时的。我们要借助于现有的数据库进一步锁定致病SV。比如OMIM数据库,记录了很多遗传病相关的基因,我们从中筛选跟目标遗传病相关的致病基因,二者取交集,或许就能找到目标SV。如果OMIM数据没有关注的遗传病信息呢?我们可以根据患者的表型信息,通过检索HPO数据库,筛选表型相关的基因,然后再与我们的候选SV进行比较获得目标SV。

至此,我们筛选到了我们的目标SV,那是不是到这里就结束了,并没有。

06 SV验证

拿到了目标SV,还并不能直接发文章,还需要其他证据来佐证这个结果。首先就是SV的真实性验证,要在先证者、正常对照中验证SV是否真实存在。其次验证SV的遗传性,其父母是否存在该SV,该SV的遗传过程是否符合遗传规律。再次是功能性验证,比较直接的方法是通过转录组测序,查看相关基因的表达情况,确认该SV是否影响了该基因的正常表达,至此我们完成了疾病SV的万里挑一。

图8 家系验证结果和PCR验证结果举例[5]

以上为小编个人经验之谈,仅供参考,不足之处,欢迎指正。

参考文献
【1】Mitsuhashi, Satomi and Naomichi Matsumoto. Long-read sequencing for rare human genetic diseases. Journal of Human Genetics 65, 11-19 (2019) .
【2】Nattestad, M. et al. Complex rearrangements and oncogene amplifications revealed by long-read DNA and RNA sequencing of a breast cancer cell line. Genome Res. 28, 1126–1135 (2018).
【3】Mizuguchi, T. et al. Detecting a long insertion variant in SAMD12 by SMRT sequencing: implications of long-read whole-genome sequencing for repeat expansion diseases. J. Hum. Genet. 64, 191–197 (2019).
【4】Merker, J. D. et al. Long-read genome sequencing identifies causal structural variation in a Mendelian disease. Genet. Med. 20, 159–163 (2018).
【5】Mizuguchi, T. et al. A 12-kb structural variation in progressive myoclonic epilepsy was newly identified by long-read whole-genome sequencing. J. Hum. Genet. 64, 359–368 (2019).

作者:大行山
审稿:童蒙
编辑:angelica

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容