linux三剑客/代码屠夫sed,grep,xargs初尝试

最近公司项目代码从gogs迁移到gitlab上,项目中大量的pod子组建里的podspec配置,git配置,还有各种脚本里的服务器地址都需要替换。所以就写了python脚本全局替换。无意中发现前同事遗留下来的shell脚本,看上去比python简洁得多,其中一个sed命令引起我的注意,于是研究了一下,确实强大。本文主要记录使用sed,grep,xargs工具由简到繁最终解决问题的过程,以及自我总结。

sed简介

SED的英文全称是 Stream EDitor,它是一个简单而强大的文本解析转换工具,在1973-1974年期间由贝尔实验室的Lee E. McMahon开发,今天,它已经运行在所有的主流操作系统上了。

SED的典型用途
  • 文本替换
  • 选择性的输出文本文件
  • 从文本文件的某处开始编辑
  • 无交互式的对文本文件进行编辑等
示例(Example)
  • 匹配链接
sed -n '/http:\/\/.*\/[a-zA-Z]*\.git/ p' UpdatePodScript.sh

在文件UpdatePodScript.sh匹配项目的git地址,p命令是指打印匹配结果,-n指禁止输入文件读入sed模式空间时默认输出,避免重复输出,一般-np同时使用。

  • 匹配目标(需要替换)部分
sed -n 's|http:\/\/\(.*\)\/[a-zA-Z]*\.git|\1| p' UpdatePodScript.sh
// 匹配完整的git链接
sed -n 's/\(http:\/\/\)\(.*\)\(\/[a-zA-Z]*\.git\)/\1GogsAddress\3/ p' UpdatePodScript.sh
// 用|,@,^,!进行分隔,去除\转义符,便于阅读
sed -n 's@\(http://\)\(.*\)\(/[a-zA-Z]*\(\.git\)\{0,1\}\)@\1GogsAddress\3@ p' LYHttpManager.podspec

括号内就是你需要替换的内容,\1是括号内内容的别称,如果有多个括号对应别称就是顺延\1\2\3、... 注意这里括号需要转义\(xxx\)

  • 匹配并替换目标部分
sed -i '' 's@\(http://\)\(.*\)\(/[a-zA-Z]*\(\.git\)\{0,1\}\)@\1GogsAddress\3@g' LYHttpManager.podspec

-i:直接修改读取的文件内容,而不是输出到终端。
'':取消因为mac系统对sed命令要求的强制备份。
s:替换命令,格式'/s/oldstring/newstring',将oldstring替换成newstring,默认只替换文件里的第一个oldstring。
g:替换文件里的全部oldstring。

这里有一个问题,sed正则是不是不支持?,+,我试过匹配不出来。

  • 匹配替换grep搜索的所有结果(最终命令)
grep -rl 'GitLabAddress' . | sed 's/ /\\ /g' | xargs sed -i '' 's@\(http://\)\(.*\)\(/[a-zA-Z]*\(\.git\)\{0,1\}\)@\1GogsAddress\3@g'
// 因为是1对1的替换,所以不需要正则匹配,把正则换成链接字符串。
grep -rl 'GogsAddress' . | sed 's/ /\\ /g' | xargs sed -i '' 's@GogsAddress@GitLabAddress@g'

-r:遍历目录及所有子目录。
-l:只显示符合条件的文件名(包含路径)

整个命令通过|分为三部分:

  1. 获取包含'GogsAddress'字符串的所有文件名。
  2. 将路径中空格' '转义成'\ '.
  3. 将'GogsAddress'替换成'GitLabAddress'。
sed与python
  • sed
grep -rl 'GogsAddress' . | sed 's/ /\\ /g' | xargs sed -i '' 's@GogsAddress@GitLabAddress@g'
  • python
#!/usr/bin/python
# -*- coding: UTF-8 -*-

import os
import re
import sys

# profile文件目录
# ROOT_PATH = '/Users/wans/Documents/iOSUser/Code/LYLawyerPlatform_User'

GITLAB_HOST_ADDRESS = "GitLabAddress"
ROOT_PATH = os.getcwd()

def replace_address(address):
    fo = open(address,'r+')
    content = fo.read()

    pattern = re.compile(r'http://(.+)/(\w+)(\.git)*')
    match = pattern.search(content)
    if match:
        old_module_address = match.group(1)

        content = content.replace(old_module_address,GITLAB_HOST_ADDRESS)

        fo = open(address, 'w')
        fo.write(content)
        fo.flush()

    if fo:
        fo.close()

def main():

    files = os.listdir(ROOT_PATH)
    for subdir in files:
        subdir = os.path.join(ROOT_PATH,subdir)
        if os.path.isdir(subdir):
            module_files = os.listdir(subdir)
            # 遍历子项目
            for module_subdir in module_files:
                module_subdir = os.path.join(subdir,module_subdir)
                if module_subdir.endswith('.git'):
                    module_dir = os.path.join(module_subdir,"config")
                    print module_dir
                    if os.path.exists(module_dir):
                        replace_address(module_dir)

                if module_subdir.endswith('Example'):
                    module_dir = os.path.join(module_subdir,"Podfile")
                    print module_dir
                    if os.path.exists(module_dir):
                        replace_address(module_dir)

                if module_subdir.endswith('.podspec'):
                    print module_subdir
                    replace_address(module_subdir)

                if module_subdir.endswith('UpdatePodScript.sh'):
                    print module_subdir
                    replace_address(module_subdir)

if __name__ == '__main__':
    main()

没有比较两个工具好坏的意思,只是直观比较而已😄。

最终一行命令解决问题,而我写的python脚本几十行,重点是sed只在终端运行就可以,只在终端运行就可以,只在终端运行就可以,所以称sed为代码屠夫也不为过。虽然sed命令简洁,但是不太明了,光那转义符都看得头晕,可读性不高。but,我还是倾向于用sed解决问题,恩,没有为什么。😄

以上

完全现学现用,见笑了,就算抛砖引玉吧。

参考资料
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容

  • linux资料总章2.1 1.0写的不好抱歉 但是2.0已经改了很多 但是错误还是无法避免 以后资料会慢慢更新 大...
    数据革命阅读 12,156评论 2 33
  • 基础命令 主要的命令和快捷键 Linux系统命令由三部分组成:cmd + [options]+[operation...
    485b1aca799e阅读 1,094评论 0 0
  • sed与awk实例 文本间隔 在每一行后面增加一空行 将原来的所有空行删除并在每一行后面增加一空行。这样在输出的文...
    stuha阅读 1,893评论 0 21
  • 本文承接之前写的三十分钟学会AWK一文,在学习完AWK之后,趁热打铁又学习了一下SED,不得不说这两个工具真的堪称...
    mylxsw阅读 4,393评论 3 74
  • 本文笔记源自这里——[实验楼]欢迎大家在下面交流其中有问题的地方喜欢请点收藏,每日更新(全部已亲自实践). 一. ...
    东皇Amrzs阅读 3,979评论 7 54