查看原始数据的的列数
wc -l <filename>
2134124
按照1:4的比例分割 测试集:训练集
sed -n '1,426824p' CAZyDB.07312018.fa > test.fa
sed -n '426825, 2134124p' CAZyDB.07312018.fa > train.fa
查看原始数据的的列数
wc -l <filename>
2134124
按照1:4的比例分割 测试集:训练集
sed -n '1,426824p' CAZyDB.07312018.fa > test.fa
sed -n '426825, 2134124p' CAZyDB.07312018.fa > train.fa