学习小组Day7笔记—我爱一朵向阳花

测序基础知识

了解第一到三代测序技术

概述
第一代测序技术
第二代测序技术
第三代测序技术

二代测序必备名词(引自教程作者:刘小泽)这个教程把接头上的东西讲得很清楚!

双端测序: 可能序列比较长有四五百bp,两边各测120-150bp

junction: 双端测序中间一些没有测到的区域

flowcell构造:一个lane包含两列(swath),每一列有60个tile,每个tile会种下不同的cluster,每个tile在一次循环中会拍照4次(每个碱基一次)

再引用一张接头图片,作为记录:


生信星球:Adapter介绍

DNA序列表征

记录一下常常忘记的各种字母

A =腺嘌呤
C =胞嘧啶
G =鸟嘌呤
T =胸腺嘧啶
U =尿嘧啶
R = GA(嘌呤)
Y = TC(嘧啶)
K = GT(酮)
M = AC(氨基)
S = GC
W = AT
B = GTC
D = GAT
H = ACT
V = GCA
N = AGCT(任何)

常用文件格式的转换命令和软件整理

Fastq文件→Fasta文件
Linux命令

#第一种
sed '/^@/!d;s//>/;N' your.fastq > your.fasta
#第二种
seqtk seq -A input.fastq  > output.fasta

FASTX-Toolkit
•一款用于处理Short-Reads FASTA/FASTQ文件的程序,里面包含了丰富的Fasta/Fastq文件格式转换、统计等命令。
FASTX-Toolkit

EMBL → Fasta格式转换(在线工具):
http://www.geneinfinity.org/sms/sms_embltofasta.html

一个常见测序文件格式解析的网站,用于查找某种格式文件各行各列的含义:
https://genome.ucsc.edu/FAQ/FAQformat.html#format1

七天的学习小组任务完成!感谢花花(简书:小洁忘了怎么分身 )的指导和帮助。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 测序原理 学习资源 原理介绍视频:https://share.weiyun.com/5qojuBY 密码:bxsr...
    滴答滴答的小火车阅读 2,707评论 0 0
  • 测序过程和原理 第一代测序 Sanger测序原理由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形...
    卅衣阅读 4,496评论 0 1
  • FASTX-Toolkit介绍 背景介绍 高通量测序数据下机后的原始fastq文件,包含4行,其中一行为质量值,另...
    oddxix阅读 13,938评论 0 6
  • 测序知识 1. 测序概述 测序发展史: 2. 二代测序(高通量测序;NGS) 2.1 大体流程(illumina)...
    韧_7e6f阅读 3,047评论 0 0
  • 最后一天在豆豆花花的引导下成长教程的知识总结特别好是我一直接触又疑惑的部分喜欢这样的系统归纳真诚致谢 学习内容 怎...
    尹露茜阅读 2,394评论 0 0