2022.8.18 测序.png
三代测序.png
测序
image.png
DNA 测序技术的发展:第三代测序法 (qq.com)
测序发展史:150年的风雨历程 (qq.com)
基因数据
image.png
-
Fastq:一种文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式,一般都包含有4行。【第一行:由‘@’开始,后面跟着序列ID和可选的描述,序列ID是唯一的;第二行:碱基序列;第三行:由‘+’开始,后面是序列的描述信息;第四行:第二行序列的质量评价(quality value)】image.png
- Fastq文件→Fasta文件
Linux命令
方法1:sed '/^@/!d;s//>/;N' your.fastq > your.fasta
方法2:seqtk seq -A input.fastq > output.fasta
image.png -
数据库image.png
- EMBL → Fasta格式转换(在线工具):
http://www.geneinfinity.org/sms/sms_embltofasta.html - 常见测序文件格式解析的网站:
https://genome.ucsc.edu/FAQ/FAQformat.html#format1