TCL
文件测试:
file exists $name
file isdirectory $name
file isfile $name
file readable $name
file writable $name
file executable $name
文件路径、文件名
set name /path/a/b/c.txt file extension $name
split 命令:
split string ?splitchars?
eg:
1. split "comp.lang.tcl.announce" .
comp lang tcl announce
2. split "alpha beta gamma" "temp"
al {ha b} {} {a ga} {} a
3. 从一个字符串中释放列表字符
split "Example with {unbalanced brace character"
Example with /{unbalanced brace character
4. 分解一个字符串为单独的字符列表
split "Hello world" {}
H e l l o { } w o r l d
正则表达式:
. 匹配任意字符
* 匹配前面模式中的零个或者任意个
+ 匹配前面模式中的一个或者任意个
? 匹配前面模式中的零个或者一个
() 创建一个子模式
| 交替匹配,只能匹配其中的一个模式,不能同时匹配
[] 用来表示一个区间
^ 将一个模式挂靠在要匹配的字符串的最前面
$ 将一个模式挂靠在要匹配的字符串的最后面
regexp 命令:
regexp [选项] <正则表达式> <匹配的原始字符串> <保存匹配后字符串的变量> [其他保存子模式匹配字符串的变量]
eg:
1. regexp {A+} "AABBCC" match
puts $match
输出: AA
2. regexp {(AA)(BB)(CC)} "AABBCC" match sub1 sub2 sub3
puts $match
puts $sub1
puts $sub2
puts $sub3
输出:AABBCC AA BB CC
3. regexp {[ADEFG]} "AAABBBCCC" match
puts $match
输出:A
上面的表达式表示匹配ABEFG这5个字符中的一个,只是一个
4. regexp {[ADEFG]+} "AAABBBCCC" match
puts $match
输出:AAA
这个关键字使用必须小心,因为在TCL语言中[] 还有另外一个含义:
所有处于[]中的内容是一条TCL命令,因此在regexp中使用的时候,必须用{}将[]的其他含义取消掉,如果将{}换成"",那么上面的命令会报错。
5. regexp {(AAA)} "BBBAAACCC" match
输出:AAA
regexp {^(AAA)} "BBBAAACCC" match
无法匹配
^这个字符也有2义性,如果把它放在中括号里面的话,它表示【非】的意思,比如[^a-z]表示匹配不是a-z字母的其他字符,
但是不在中括号里面,比如^ab表示必须最前面是ab这2个字符,这是很容易搞混的地方,一定要注意了。
6. $ 与^ 相反
高级正则表达式:
1. 反斜杠字符序列
\d 表示0-9之间的数字
\D 表示除了0-9之间数字的其他字符,与\d作用相反
\s 空白符,包括空格、换行、回车、制表、垂直制表、换页符等
\S 非空白符,与\s 相反
\w 数字、字母和下划线
\W 非数字、字母和下划线的其他字符
\uXXXX 16位Unicode 字符编码
\n 换行符,Unicode码是\u000A
\r 换页符,Unicode码是\u000D
\t 制表符,Unicode码是\u0009
2. 字符类,除了反斜杠字符序列,高级正则表达式还支持字符类匹配,字符类就是利用一个单词代表复杂意思,
大部分的字符类与反斜杠序列含义相同,但也有一些字符类是特有的,比如匹配16进制字符的xdigit,
几乎所有情况下只要使用字符类就必须将它们放在[[: :]]符号中,下面的表格列出了所有字符类:
[[:alnum:]] 大小写字母和数字,不包括下划线
[[:alpha:]] 大小写字母
[[:blank:]] 空格和制表符
[[:cntrl:]] 控制字符,也就是ASCII码表中1-31号的字符
[[:digit:]] 0-9之间的数字,与\d的含义相同
[[:graph:]] 所有可以显示的字符
[[:lower:]] 小写字母
[[:print:]] alnum的另外一种表示方法
[[:punct:]] 所有标点字符
[[:space:]] 空白字符,与\s的含义相同
[[:upper:]] 所有大写字母
[[:xdigit:]] 所有16进制数字,包括0-9 a-f A-F
3. 扩展的正则表达式语法
扩展语法中,我认为最为重要和方便的就是{}语法,它可以精确指定前面模式匹配的次数,{}语法有3种基本使用方法:
{m} 匹配前面模式的m次
{m,} 匹配前面模式最少m次,最多无限次
{m,n} 匹配前面模式最少m次,最多n次
在实际使用时还可以在{}语法后面加上 ? 号表示非贪婪匹配