学习小组Day7笔记-王康

测序知识

测序类型及原理

  1. 第一代DNA测序技术桑格尔-双脱氧链终止法
  • 特点:读长长(1000 bp),准确性高(99.999%),通量低
  • 原理:
    桑格尔-双脱氧链终止法
  1. 第二代DNA测序技术-循环阵列合成测序法
  • 特点:通量高、时间短、读长短
  • 原理:
    (1)sample prep(DNA文库构建):将基因组DNA随机片段化,然后修补成平末端,最后加上特定的接头(Adaptors),构建成DNA文库。
    (2)cluster generation(簇生成):Flowcell上面连有两种Adaptors(P5、P7),当DNA经变性后流经Flowcell时,利用Flowcell上的接头与DNA两端的接头相互匹配。DNA进行桥式PCR扩增,从而将碱基信号放大。通过桥式PCR不断循环获得上百万条成簇分布的双链待测片段。
    (3)测序
    (4)数据产出
  1. 第三代DNA测序技术-SMRT和纳米孔单分子测序技术
    SMRT技术:采用边合成边测序方法,以SMRT芯片为测序载体,芯片上众多小孔中的DNA聚合酶和模板结合,4色荧光标记4种碱基,在碱基配对阶段,加入不同碱基会发出不同的光,根据光的波长与峰值可判断进入的碱基类型。另外,若碱基存在修饰,则通过聚合酶的速度会减慢,因此可以通过检测相邻两个碱基之间的测序时间、两峰之间的距离来检测甲基化等碱基修饰情况。
  • 特点:无需PCR扩增,读长长,无视GC含量的影响



    纳米孔单分子测序技术:在膜两侧施加电压,分子马达驱动DNA分子通过纳米孔,导致电荷发生变化,每种碱基引起的电流变化是不同的,通过检测这些电流进而转化为对应的碱基序列。


    三代测序技术比较

名词结构化

  • 基因组学作用:
    (1)基因组作图(遗传图谱、物理图谱、转录本图谱)
    (2)核苷酸序列分析
    (3)基因定位
    (4)基因功能分析
    (5)其它:以全基因组测序为目标的结构基因组学;以基因功能鉴定为目标的功能基因组学
  • 转录组学(基因表达分析)作用:
    (1)获得物种或者组织的转录本信息
    (2)得到转录本上基因的相关信息,如基因结构功能等
    (3)发现新的基因
    (4)基因结构优化
    (5)发现可变剪切
    (6)发现基因融合
    (7)基因表达差异分析
  • 蛋白质组学作用:
    (1)蛋白质组数据处理、蛋白及其修饰鉴定(2)构建蛋白质数据库、相关软件的开发和应用
    (3)蛋白质结构功能预测
    (4)蛋白质连锁图
  • 代谢组学作用:
    (1)代谢物指纹分析
    (2)代谢轮廓分析

常用数据格式

  1. DNA序列表征
    A C G T U
    R = GA(嘌呤)
    Y = TC(嘧啶)
    K = GT(酮)
    M = AC(氨基)
    S = GC
    W = AT
    B = GTC
    D = GAT
    H = ACT
    V = GCA
    N = AGCT(任何)
  2. Fastq & Fasta
    Fastq格式:一种基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式,一般都包含有4行。

    第一行:由‘@’开始,后面跟着序列ID和可选的描述,序列ID是唯一的;
    第二行:碱基序列;
    第三行:由‘+’开始,后面是序列的描述信息;
    第四行:第二行序列的质量评价。

    Fasta格式:

    1.以“>”为开头,fasta格式标志。
    2.序列ID号,gi号,NCBI数据库的标识符,具有唯一性。格式为:gi|gi号|来源标志|序列标志(接收号、名称等),若某项缺失可以留空,“|”保留。
    3.序列描述。
    4.碱基序列,序列中允许空格、换行、空行,一般一行60个。
    Fastq文件→Fasta文件
    Linux命令
    法1:sed '/^@/!d;s//>/;N' your.fastq > your.fasta
    法2:seqtk seq -A input.fastq > output.fasta
  3. GenBank & EMBL
    GenBank格式:以LOCUS和一些注释行开始。序列的开头以“ORIGIN”标记,末尾以“//”标记。

    EMBL格式:以标识符行(ID)开头,后面跟着更多注释行。序列的开头以“SQ”开头标记,序末尾以“//”标记。

    GenBank & EMBL数据库格式的对比

    EMBL → Fasta格式转换(在线工具):http://www.geneinfinity.org/sms/sms_embltofasta.html
    常见测序文件格式解析的网站:https://genome.ucsc.edu/FAQ/FAQformat.html#format1
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,701评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,649评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,037评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,994评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,018评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,796评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,481评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,370评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,868评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,014评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,153评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,832评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,494评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,039评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,156评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,437评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,131评论 2 356

推荐阅读更多精彩内容