一个没有什么卵用的从fastq随机抽取序列的Python脚本

这是我刚开始学习Python和生物信息学时写的一个练手脚本,写完之后成就感满满,结果不久就发现了一个处理序列的好工具seqtk,感觉这个脚本真是没有什么卵用。


import random

output_file = open(r"/its1/PROJECT/test/100000.fq","w")
seqs = []
with open(r"/its1/PROJECT/test/C1.fq","r") as input_file:
    seqs = input_file.readlines()
    num_lines = len(seqs)
    total_records = num_lines / 4
    total_records = int(total_records)
    list = range(1, (total_records+1))
    slice = random.sample(list, 100000)
for n in slice:
    m = n - 1
    m = m * 4
    seq = seqs[m]
    output_file.write(seq.strip()+"\n")
    seq = seqs[m+1]
    output_file.write(seq.strip()+"\n")
    seq = seqs[m+2]
    output_file.write(seq.strip()+"\n")
    seq = seqs[m+3]
    output_file.write(seq.strip()+"\n")
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Python 资源大全中文版 awesome-python[https://github.com/vinta/aw...
    万色星辰阅读 13,274评论 0 255
  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,746评论 6 427
  • 环境管理管理Python版本和环境的工具。p–非常简单的交互式python版本管理工具。pyenv–简单的Pyth...
    MrHamster阅读 9,260评论 1 61
  • Python常用库大全,看看有没有你需要的。 环境管理 管理 Python 版本和环境的工具 p – 非常简单的交...
    XDgbh阅读 15,943评论 4 147
  • 印谚云:开斋节的月亮(ईद का चाँद)。 印度人久违重逢,见面说,你都成了“开斋节的月亮”了。(至少...
    sudhir阅读 3,744评论 0 1

友情链接更多精彩内容