处理数据过程中的一些小技巧(持续更新)

Linux

  1. 以列为单位合并两个文件
  paste file1 file2 > output.txt
  1. 使用awk提取文件中某两列有多少相同元素
awk 'NR>1{if($1==$2) {count++; print NR}} END{print count}' 123 | wc -l
  1. 使用awk提取文件中第一行中包括特定元素的字符串所对应的列的内容
awk 'NR==1 {for(i=1;i<=NF;i++) {if($i ~ /11/) {cols[i]=1}}} {for(i in cols) printf("%s ",$i); printf("\n")}' 123 | less -S
  1. 使用split将文件拆分成特定行数或者特定大小的文件
    Linux命令之文件分割split命令
eg.
split -l 10000 SPS-01.fq SPS-01
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容