1 less
space bar翻页, g第一行
G最后一行, j下, k上, /<pattern>往下搜索模式, ?<pattern>往上搜索模式, n前一个匹配字符, N后一个匹配字符。
-S 行过长时间将超出部分舍弃
-N 显示每行的行号
more 命令, cat vim 命令也可以查看文本
2 grep
比如我们要去除 空白行和行首为 #的行, 会这样用:
grep -v '^$' regular_express.txt | grep -v '^#'
-v选项排除匹配到的, -w进行完全匹配
-B指定输出包括匹配到的前多少行,比如 -B1就是前一行; -A指定输出包括匹配到的后多少行,比如 -A2就是包括了后两行。 -C指定输出包括匹配到的前后多少行。 grep支持基本正则表达式, -E指定支持扩展表达式,或者用 egrep命令。 -c选项对匹配的行计数; -o选项只抽离输出匹配的部分
3 cut
grep -v "^>" kup.fasta | head -n 1 |cut -f 1-3
cut -f 看指定列
-d选项可以指定分隔符
使用 column命令来格式化输出
grep -v "^>" kup.fasta | head -n 10 |cut -f 1-3|column -t
column -s "," -t #可以改变分隔符
grep -v "^>" kup.fasta | head -n 10 |cut -f 1-3| sed 's/"//g' | sort | uniq | head -n 10 #去除冗余,只要唯一
#一般uniq和head要连起来使用。先把一样的放在一起,再进行删除。
uniq -c 选项计数
uniq -d 只输出重复行
4 join
合并两个文件,需要有共同的一列,所以我们sort之后join。
join -1 <file_1_field> -2 <file_2_field> <file_1> <file_2>
join -1 1 -2 1 example_sorted.bed example_length.txt > example_with_length.txt
如果文件内容不一致,我们可以-a选项指定哪一个文件可以不遵循配对,不然不一致的行就会被删除。
5 其他
ls -lh以易读形式查看文件大小
wc -l 看行数
head tail -n选项可以指定行数
awk -F " " '{print NF;exit}' filename 输出文档列数,只输出第一行的。
tail -n +2 kup.fasta | head -n 1 删除前两行,并check一下
grep -v "^>" kup.fasta | head -n 2 去除含有>的行,并看第二行
file filename 查看文件类型
6 awk
awk '{print $0}' example.bed
#表示所有列
wsx@wsx-ubuntu:/tmp$ awk '$3 - $2 >18' example.bed
chr1 9 28
wsx@wsx-ubuntu:/tmp$ awk '$1 ~/chr1/ && $3 - $2 > 10' example.bed
chr1 26 39
chr1 32 47
chr1 9 28
# 这里 ~ 符号用来匹配正则表达式
#还有 awk存在一些变量,像 NR表示行号, OFS表示输出分隔符等。
wsx@wsx-ubuntu:/tmp$ awk 'NR >= 3 && NR <= 5' example.bed
chr3 11 28
chr1 40 49
chr3 16 27
Linux awk语句示例
7 sed
内容太多了。
生新技能树文件
# 删除空行
sed '/^$/d'
#每行后增加空行
sed G
# 在每5行后增加一空白行
gsed '0~5G'
# 在匹配式样“regex”的行之后插入一空行
sed '/regex/G'
# 在匹配式样“regex”的行之前和之后各插入一空行
sed '/regex/{x;p;x;G;}'
# 过滤所有的html标签
sed 's/<[^>]*>//g ; /^$/d' html.txt
# 代替 cat 功能
sed ''
# 代替 head 功能
sed '10 q'
# Dos2unix
sed 's/^M$//'
# Unix2dos
sed 's/$/\r/'
# nl(添加行号)
# sed行号会独占一行
sed = input.file | sed 'N;s/\n/\t/'
# tee
sed ‐n 'p; w new.txt'
# 代替 grep 功能
sed ‐n '/pattern/p'
# grep -v
sed ‐n '/pattern/p!'
# 计算行数
sed -n '$='
# 多个内容同时替换
sed 's/a\|b\|c/d/' tmp.txt
# 将每两行连接成一行
sed '$!N;s/\n/ /'
# 如果当前行以等号开头,将当前行并到上一行末尾
# 并以单个空格代替原来行头的“=”
sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D'
# 显示包含“AAA”、“BBB”或“CCC”的行(任意次序)
sed '/AAA/!d; /BBB/!d; /CCC/!d'
7 shell 脚本
ll filename 查看权限
chmod u+x filename 更改权限
sh filename
./filename
如果想把文本字符串和命令输出显示在同一行中,可以用 echo语句的 -n参数
Linux提供了一个专门的变量$?`来保存上个已执行命令的退出状态码