学习小组Day7笔记--WQQ

2022.8.18 测序.png

三代测序.png

测序

image.png

DNA 测序技术的发展:第三代测序法 (qq.com)
测序发展史:150年的风雨历程 (qq.com)

基因数据

image.png
  • Fastq:一种文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式,一般都包含有4行。【第一行:由‘@’开始,后面跟着序列ID和可选的描述,序列ID是唯一的;第二行:碱基序列;第三行:由‘+’开始,后面是序列的描述信息;第四行:第二行序列的质量评价(quality value)】
    image.png
  • Fastq文件→Fasta文件
    Linux命令
    方法1:sed '/^@/!d;s//>/;N' your.fastq > your.fasta
    方法2:seqtk seq -A input.fastq > output.fasta
    image.png
  • 数据库
    image.png
  • EMBL → Fasta格式转换(在线工具):
    http://www.geneinfinity.org/sms/sms_embltofasta.html
  • 常见测序文件格式解析的网站:
    https://genome.ucsc.edu/FAQ/FAQformat.html#format1
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容