awk & sed

awk 常见使用教程

awk 使用的时候有两个要求就是脚本必须放到{}中,由于awk命令假定脚本是单个文本字符串,所以必须将脚本放到单引号中。

gawk 是Unix 中的原始awk程序的GNU版本 所以 mac 中需要 brew install gawk && echo 'alias awk=gawk' >> ~/.zshrc


gawk '{print "hello world"}' test.txt

gawk 会对数据流中的每行文本执行脚本程序,所以上面的程序结果是打印和 test.txt 同样行数的 hello world

在每个文本行中,gawk 会根据 字段分隔符 给行元素分配变量,默认的字段分割符是任意的空白字符,但我们可以通过参数 -F 设定。
分配的数据字段如下:

  • $0 代表整个文本行
  • $1 代表文本行中的第一个数据字段
  • $n 代表的事文本行中的第n个数据字段

gawk -F : '{print $1}' /etc/passwd # 在此用冒号指定为字段分割符

nobody
root
daemon
[...]

gawk 允许你将多条命令组合成一个正常的程序。命令行之间添加分号即可, BEGIN 允许你在处理数据之前运行相关脚本, END 关键字允许指定一个脚本程序在 gawk 读取完数据后执行。


echo "My name is Rich" | gawk '{$4="test"; print $0}'

My name is test

echo "My name is Rich" | gawk 'BEGIN {print "start"} {$4="test";p
rint $0} END {print "End of File"}'
start
My name is test
End of File

sed 编辑器基础

Mac 的 sed 是 BSD 版本 注意:brew install gnu-sed --with-default-names

常见替换选项

echo "this is test a test" | sed 's/test/big test/'
this is big test a test

上面的例子使用了 s 命令,s 命令会用斜线的第二个文本替换第一个文本,但我们可以看到只是第一处进行了替换,如果要处理这种问题可以使用 替换标记,有以下四种替换标记:

  • 数字,表明新文本将替换第几处模式匹配的地方。
  • g, 表明新文本将会替换所有匹配的文本。
  • p, 表明原先行的内容要打印出来,用于显示模式缓存区的内容
  • w file, 将替换的结果写入到文件中。

echo "this is test a test" | sed 's/test/big test/g'

this is big test a big test

使用地址

正常情况下 sed 会作用到文本数据的每一行,如果只想将命令作用到特定行或者某些行,需要使用 行寻址,有以下形式:

数字方式的行寻址


sed '2s/dog/cat/' test.txt #第二行
sed '2,3s/dog/cat/' test.txt #行地址区间
sed '2,$s/dog/cat/' test.txt # 从某行开始的所有行,使用 $ 符号标记

文本模式过滤


sed '/wang/s/bash/csh/' /etc/passwd  # 前面的 wang 说明只处理匹配到该文本的行,当然使用正则是最方便。

删除行

删除命令 d 可以配合寻址模式进行删除文本

sed '2d' test.txt

插入和附件文本以及修改行

  • 插入 (insert) 命令 i 会在指定行前增加一个新行
  • 附件 (append) 命令 a 会在指定行后增加一个新行
  • 修改 (change) 命令 c 配合寻址修改行

sed '[address]command\ new line'

sed '1i\this is new line.' test.txt

this is new line.
the quick brown fox
the quick brown fox1
the quick brown fox2

sed '1a\this is new line.' test.txt

the quick brown fox
this is new line.
the quick brown fox1
the quick brown fox2

sed '$a\this is new line.' test.txt  # $ 代表最后一行

sed '2c\this is new line.' test.txt

转化命令 y


sed 'y/123/789/' test.txt

the quick brown fox
the quick brown fox7
the quick brown fox8
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,047评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,807评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,501评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,839评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,951评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,117评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,188评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,929评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,372评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,679评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,837评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,536评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,168评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,886评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,129评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,665评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,739评论 2 351

推荐阅读更多精彩内容

  • sed与awk实例 文本间隔 在每一行后面增加一空行 将原来的所有空行删除并在每一行后面增加一空行。这样在输出的文...
    stuha阅读 1,893评论 0 21
  • 博文阅读 学习内容: 学习sed编辑器gawk编辑器入门sed编辑器基础 shell脚本最常见的一个用途就是处理文...
    王诗翔阅读 1,396评论 1 9
  • 本文承接之前写的三十分钟学会AWK一文,在学习完AWK之后,趁热打铁又学习了一下SED,不得不说这两个工具真的堪称...
    mylxsw阅读 4,393评论 3 74
  • 现在把我从网上看到的sed、grep和awk之间的区别列出来,希望对自己有用。 grep主要用于搜索某些字符串 s...
    杰伦哎呦哎呦阅读 1,377评论 0 2
  • 一、awk 详细概念awk是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入(...
    Catcher07阅读 311评论 0 0