Hi-C数据质控原理

作者:ahworld
链接Hi-C数据质控原理
来源:微信公众号-seqyuan
著作权归作者所有,任何形式的转载都请联系作者。

Hi-C数据质控原理-视频

Hi-C文库的插入片段是经过酶切连接的片段,其测序数据的比对和有效数据的筛选比较特殊。这个视频重点介绍了以下3个方面:

  • Hi-C实验建库原理
  • Hi-C数据的比对策略
  • Hi-C文库的分子类型

Hi-C实验建库原理

Hi-C实验建库原理的部分重点介绍了什么样的实验建库原理导致了"PE测序的Reads1 Reads2分别来自不同的基因组酶切片段才符合Valid Pair Reads特征"

Hi-C数据常用的数据质控软件HiC-Pro的主要分为:Alignment和Map2Fragment两个主要步骤。

Hi-C数据的比对策略

在这一部分重点介绍了以下4点内容:

  1. Reads1 Reads2分别比对到基因组
  2. 挑选R1、R2分别比对到基因组唯一位置的PE Reads进行后续分
  3. Hi-C文库是junction类型,对于跨LS site的Reads有提高比对率的比对策略设计
  4. 建议在平衡unique map 和multiple map的情况下用比较短的Reads进行比对(避免Reads跨过ligation site)

Hi-C文库的分子类型

这一节主要讲了,对来源于相同酶切片段的PE Reads进行细分统计,有利于我们改进Hi-C实验条件,实现Valid reads比例的提升。Dangling 太高可能是由于连接步骤不好,导致后面步骤末端生物素没有去除干净等原因

对map到不同酶切片段的Pre Valid Pair Reads再进行严格质控是Dumped reads pair的主要来源。具体的严格质控点包括:

  1. R1/R2 所在的Fragment1/Fragment2 大小不符合设定范围
  2. Prediction insert size不在设定的参数范围

“R1和R2比对到同一条染色体的情况,R1与R2比对位置之间的线形距离过小”的情况该不该被去除?,如果想去除选择设置哪个参数?

Re-Ligation是什么?怎样产生的?

Hi-C文库的PCR Dup应该怎么处理?为什么需要处理。

如果对这些问题感兴趣,欢迎观看视频。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容

  • 来源: 三维基因组Magic [三维基因组Magic](javascript:void(0);) 2017-11-...
    caokai001阅读 10,238评论 5 31
  • 基于Hi-C数据的深层挖掘和多组学联合分析已经成为了三维基因组领域的重要组成部分。而工欲善其事必先利其器,夯实基础...
    Ray钱阅读 12,924评论 0 35
  • SAM(The Sequence Alignment / Map format)格式,即序列比对文件的格式,详细介...
    oddxix阅读 1,703评论 0 1
  • 姓名:汤晶 公司:常州新日催化剂有限公司 【日精进打卡第35天】 【知~学习】 《六项精进》0遍 共177遍 ...
    晶晶_7485阅读 84评论 0 0
  • 相信很多人都做过自我介绍,但是大多情况下,很多人都羞于对站在人多的地方向大家介绍自己,第1个不知道怎么去开口介绍自...
    坚持坚持再坚持00阅读 216评论 0 2