学习小组Day7笔记-王康

测序知识

测序类型及原理

第一代DNA测序技术桑格尔-双脱氧链终止法

特点：读长长（1000 bp），准确性高（99.999%），通量低
原理：

桑格尔-双脱氧链终止法

第二代DNA测序技术-循环阵列合成测序法

特点：通量高、时间短、读长短
原理：
（1）sample prep(DNA文库构建)：将基因组DNA随机片段化，然后修补成平末端，最后加上特定的接头（Adaptors），构建成DNA文库。
（2）cluster generation（簇生成）：Flowcell上面连有两种Adaptors（P5、P7），当DNA经变性后流经Flowcell时，利用Flowcell上的接头与DNA两端的接头相互匹配。DNA进行桥式PCR扩增，从而将碱基信号放大。通过桥式PCR不断循环获得上百万条成簇分布的双链待测片段。
（3）测序
（4）数据产出

第三代DNA测序技术-SMRT和纳米孔单分子测序技术
SMRT技术：采用边合成边测序方法，以SMRT芯片为测序载体，芯片上众多小孔中的DNA聚合酶和模板结合，4色荧光标记4种碱基，在碱基配对阶段，加入不同碱基会发出不同的光，根据光的波长与峰值可判断进入的碱基类型。另外，若碱基存在修饰，则通过聚合酶的速度会减慢，因此可以通过检测相邻两个碱基之间的测序时间、两峰之间的距离来检测甲基化等碱基修饰情况。

特点：无需PCR扩增，读长长，无视GC含量的影响

纳米孔单分子测序技术：在膜两侧施加电压，分子马达驱动DNA分子通过纳米孔，导致电荷发生变化，每种碱基引起的电流变化是不同的，通过检测这些电流进而转化为对应的碱基序列。

三代测序技术比较

名词结构化

基因组学作用：
（1）基因组作图（遗传图谱、物理图谱、转录本图谱）
（2）核苷酸序列分析
（3）基因定位
（4）基因功能分析
（5）其它：以全基因组测序为目标的结构基因组学；以基因功能鉴定为目标的功能基因组学
转录组学（基因表达分析）作用：
（1）获得物种或者组织的转录本信息
（2）得到转录本上基因的相关信息，如基因结构功能等
（3）发现新的基因
（4）基因结构优化
（5）发现可变剪切
（6）发现基因融合
（7）基因表达差异分析
蛋白质组学作用：
（1）蛋白质组数据处理、蛋白及其修饰鉴定（2）构建蛋白质数据库、相关软件的开发和应用
（3）蛋白质结构功能预测
（4）蛋白质连锁图
代谢组学作用：
（1）代谢物指纹分析
（2）代谢轮廓分析

常用数据格式

DNA序列表征
A C G T U
R = GA（嘌呤）
Y = TC（嘧啶）
K = GT（酮）
M = AC（氨基）
S = GC
W = AT
B = GTC
D = GAT
H = ACT
V = GCA
N = AGCT（任何）
Fastq & Fasta
Fastq格式：一种基于文本的，保存生物序列（通常是核酸序列）和其测序质量信息的标准格式,一般都包含有4行。

第一行：由‘@’开始，后面跟着序列ID和可选的描述，序列ID是唯一的；
第二行：碱基序列；
第三行：由‘+’开始，后面是序列的描述信息；
第四行：第二行序列的质量评价。
Fasta格式：

1.以“>”为开头，fasta格式标志。
2.序列ID号，gi号，NCBI数据库的标识符，具有唯一性。格式为：gi|gi号|来源标志|序列标志（接收号、名称等），若某项缺失可以留空，“|”保留。
3.序列描述。
4.碱基序列，序列中允许空格、换行、空行，一般一行60个。
Fastq文件→Fasta文件
Linux命令
法1：sed '/^@/!d;s//>/;N' your.fastq > your.fasta
法2：seqtk seq -A input.fastq > output.fasta
GenBank & EMBL
GenBank格式：以LOCUS和一些注释行开始。序列的开头以“ORIGIN”标记，末尾以“//”标记。

EMBL格式：以标识符行（ID）开头，后面跟着更多注释行。序列的开头以“SQ”开头标记，序末尾以“//”标记。

GenBank & EMBL数据库格式的对比

EMBL → Fasta格式转换（在线工具）：http://www.geneinfinity.org/sms/sms_embltofasta.html
常见测序文件格式解析的网站：https://genome.ucsc.edu/FAQ/FAQformat.html#format1

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,701评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,649评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 166,037评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,994评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,018评论 6赞 395
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,796评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,481评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,370评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,868评论 1赞 319
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,014评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,153评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,832评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,494评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,039评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,156评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,437评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,131评论 2赞 356

学习小组Day7笔记-王康

测序类型及原理

名词结构化

常用数据格式

推荐阅读更多精彩内容