2018-06-24(生信第二题)

题目:假设有如下的fasta格式文件,想把多行序列合并成一行,怎么做?


(多行)

看到这个题目首先想到的是建一个空的字符串,然后把除了含“>”之外的序列合并到一起,然后打印出来,合并的方法想到的是字符串直接相加的方法。但是个有问题,就是对于多个序列就没办法操作了。所以先对单个序列试试,将序列写入到test_tmp.fa文件中。cat一下发现个问题,就是出现了空行,如下


去除空行的方法,想到最近学习的linux命令中的sed命令,可以完成对空行的去除,如下


对这个序列操作


但是对于多个序列而言,这样的方法肯定不行,所以想到的是用字典的方式,将序列名那行和对应的序列构建成一个字典,然后将字典打印出来,就可以完成,如下



这样就完成了fasta序列中多个序列多行合并成一行的问题了

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 第十章 使用序列数据 生物信息学的核心问题之一是处理大量的(通常定义糟糕或模糊)文件格式。久而久之,一些特定的简单...
    yangliunk1987阅读 5,100评论 3 53
  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,498评论 0 5
  • 〇、前言 本文共108张图,流量党请慎重! 历时1个半月,我把自己学习Python基础知识的框架详细梳理了一遍。 ...
    Raxxie阅读 19,104评论 17 410
  • 这是一篇2013年我做记者时候写的文章,当时我所在的杂志社《新西湖》开辟了一个专栏,叫做《十年老朋友》,我因此认识...
    卖土鸡的小不拉拉阅读 1,141评论 0 51
  • 早上阅读完再写复盘的坏处之一就是满脑子全是早上阅读的内容,完全想不起来昨天实际生活中发生了什么值得总结和反思的事情...
    姚Fay阅读 827评论 0 0