比较两个基因名文件的差异
有时候需要比较两个只有基因名的文件时,可以用将每个文件读入,并用集合(set)的算法,来比较两个文件
如:
file1.txt
gene1
gene2
gene3
gene4
gene5
gene6
file2.txt
gene1
gene2
gene4
gene7
gene8
gene10
具体python代码如下:
import sys
#用sys.argv[1]和[2]来接收两个文件
file1 = open(sys.argv[1], 'r').readlines()
file2 = open(sys.argv[2], 'r').readlines()
#接收的文件转换成集合,然后用 ^ 来计算两个集合的对称差集
differece = set(file1) ^ set(file2)
outtxt = open('output_diff_file.txt', 'w')
for line in differece:
outtxt.write(line)
outtxt.close()
接下来在命令行中输入python脚本加上两个txt文件就能输出名为'output_diff_file.txt'的文件了,这个文件就是file1和file2中有差异的基因名了。