Python:从fastq.gz文件中提取特定长度的reads,生成fastq(二)

初级优化

import time
start = time.time()
import glob
import gzip
length=[]
with gzip.open('H-CK-1-3_clean.fq.gz','rt') as fp:
    i = 0 
    for line in fp:
        i += 1
        if i % 4 == 2: 
            if len(line)-1==50:
                length.append(i-1)
                length.append(i)
                length.append(i+1)
                length.append(i+2)
output_fastq = open("temp1.fq",'w')
def WRIRE1():
    N= 0       
    with gzip.open('H-CK-1-3_clean.fq.gz','rt') as fp:
        for line in fp:
            N += 1
            if N in length: 
                output_fastq.write(line)
WRIRE1()
output_fastq.close()    
end = time.time()
print("used %s s" % str(end - start))
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。