一些linux命令行学习

1 less

space bar翻页, g第一行
G最后一行， j下， k上, /<pattern>往下搜索模式， ?<pattern>往上搜索模式， n前一个匹配字符， N后一个匹配字符。
-S 行过长时间将超出部分舍弃
-N 显示每行的行号

more 命令， cat vim 命令也可以查看文本
2 grep

比如我们要去除 空白行和行首为 #的行， 会这样用：
grep -v '^$' regular_express.txt | grep -v '^#'
-v选项排除匹配到的， -w进行完全匹配

-B指定输出包括匹配到的前多少行，比如 -B1就是前一行； -A指定输出包括匹配到的后多少行，比如 -A2就是包括了后两行。 -C指定输出包括匹配到的前后多少行。 grep支持基本正则表达式， -E指定支持扩展表达式，或者用 egrep命令。 -c选项对匹配的行计数； -o选项只抽离输出匹配的部分
3 cut

grep -v "^>" kup.fasta | head -n 1 |cut -f 1-3
cut -f 看指定列
-d选项可以指定分隔符
使用 column命令来格式化输出
grep -v "^>" kup.fasta | head -n 10 |cut -f 1-3|column -t
column -s "," -t #可以改变分隔符
grep -v "^>" kup.fasta | head -n 10 |cut -f 1-3| sed 's/"//g' | sort | uniq | head -n 10 #去除冗余，只要唯一
#一般uniq和head要连起来使用。先把一样的放在一起，再进行删除。
uniq -c 选项计数
uniq -d 只输出重复行

4 join
合并两个文件，需要有共同的一列，所以我们sort之后join。

join -1 <file_1_field> -2 <file_2_field> <file_1> <file_2>
join -1 1 -2 1 example_sorted.bed example_length.txt > example_with_length.txt

如果文件内容不一致，我们可以-a选项指定哪一个文件可以不遵循配对，不然不一致的行就会被删除。
5 其他

ls -lh以易读形式查看文件大小
wc -l 看行数
head tail -n选项可以指定行数
awk -F " " '{print NF;exit}' filename 输出文档列数，只输出第一行的。
tail -n +2 kup.fasta | head -n 1 删除前两行，并check一下
grep -v "^>" kup.fasta | head -n 2 去除含有>的行，并看第二行
file filename 查看文件类型

6 awk

awk '{print $0}' example.bed
#表示所有列
wsx@wsx-ubuntu:/tmp$ awk '$3 - $2 >18' example.bed

chr1    9   28

wsx@wsx-ubuntu:/tmp$ awk '$1 ~/chr1/ && $3 - $2 > 10' example.bed

chr1    26  39

chr1    32  47

chr1    9   28


# 这里 ~ 符号用来匹配正则表达式
#还有 awk存在一些变量，像 NR表示行号， OFS表示输出分隔符等。
wsx@wsx-ubuntu:/tmp$ awk 'NR >= 3 && NR <= 5' example.bed

chr3    11  28

chr1    40  49

chr3    16  27

Linux awk语句示例
7 sed
内容太多了。
生新技能树文件

# 删除空行
sed '/^$/d'
#每行后增加空行
sed G
# 在每5行后增加一空白行
gsed '0~5G'
# 在匹配式样“regex”的行之后插入一空行
sed '/regex/G'
# 在匹配式样“regex”的行之前和之后各插入一空行
sed '/regex/{x;p;x;G;}'
# 过滤所有的html标签
sed 's/<[^>]*>//g ; /^$/d' html.txt
# 代替 cat 功能 
sed ''
# 代替 head 功能 
sed '10 q'
# Dos2unix
sed 's/^M$//'
# Unix2dos
sed 's/$/\r/'
# nl(添加行号)
# sed行号会独占一行
sed = input.file | sed 'N;s/\n/\t/'
# tee
sed ‐n 'p; w new.txt'
# 代替 grep 功能 
sed ‐n '/pattern/p'
# grep -v
sed ‐n '/pattern/p!'
# 计算行数
sed -n '$='
# 多个内容同时替换
sed 's/a\|b\|c/d/' tmp.txt
# 将每两行连接成一行
sed '$!N;s/\n/ /'
# 如果当前行以等号开头，将当前行并到上一行末尾
# 并以单个空格代替原来行头的“=”
sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D'
# 显示包含“AAA”、“BBB”或“CCC”的行（任意次序）
sed '/AAA/!d; /BBB/!d; /CCC/!d'

7 shell 脚本

ll filename 查看权限
chmod u+x filename 更改权限
sh filename
./filename

如果想把文本字符串和命令输出显示在同一行中，可以用 echo语句的 -n参数
Linux提供了一个专门的变量$?`来保存上个已执行命令的退出状态码

一些linux命令行学习

推荐阅读更多精彩内容