开放问题:如何从OrthoFinder2的Single_Copy_Orthologue_Sequences蛋白序列集提取CDS进行正选择分析

已有“OrthoFinder/Results_Jul11/Orthogroups ”

ll Orthogroups
-rw-r--r-- 1  552K Jul 11 01:15 Orthogroups.GeneCount.tsv
-rw-r--r-- 1   36K Jul 11 01:15 Orthogroups_SingleCopyOrthologues.txt
-rw-r--r-- 1  8.1M Jul 11 01:15 Orthogroups.tsv
-rw-r--r-- 1 9.3M Jul 11 01:15 Orthogroups.txt
-rw-r--r-- 1  1.6M Jul 11 01:15 Orthogroups_UnassignedGenes.tsv

#随后整理
#https://www.biostars.org/p/323537/
grep -Fwf SingleCopyOrthogroups.txt Orthogroups.txt > SingleCopyOrthologsGeneIDS.txt

#https://www.biostars.org/p/274269/

再进行提取ID
 i=$(cat Orthogroups_SingleCopyOrthologues.txt | xargs )
 for j in $i; do grep "$j" SingleCopyOrthologsGeneIDS.txt | awk '{for (i=2; i<=NF; i++) print $i}'> $j.txt; done;
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容