Wego input文件准备

今天通过几行代码来准备Wego input的文件:

  1. Wego官网要求的输入文件格式(https://wego.genomics.cn/

    1639148090(1).jpg

  2. 现有GO分析结果


    1639148267(1).jpg
  3. 要把gene编号和对应的GO编号提取出来,用sed和awk命令实现。

第一步:先把##和%都替换成 \t

sed -e 's/%/\t/g' -e 's/##/\t/g' data.txt

第二步:用awk把带有GO的列输出

awk '{print $1}{ for(i=1;i<=NF;i++)if($i~/GO/) print $(i)}' go.txt >1.txt   

第三步:再把\nGO替换成GO

在vim编辑器里%s/\nGO/GO/g(因为sed里不识别\n)
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容