Linux中[]方括号匹配问题[A-Z]会匹配小写a-z

Linux中[]中括号匹配问题[A-Z]会匹配小写a-z:
在Ubuntu使用[]进行匹配时,发现ls [A-Z]*仍然可以匹配到小写字母开头的目录,这是因为语系不同,导致编码顺序不同:
LANG=C:ABC...Zabc...z
LANG=zh_CN: aAbBcC...zZ
当语系为zh_CN,[a-z] 就会包括ABC..Y
如果要用[A-Z]只表示大写字母范围,需要设置环境变量
export LC_ALL=C
取消用
unset LC_ALL

在很多shell脚本中在开头部分加LC_ALL=C就是为了去除所有本地化的设置,让命令能正确执行。
在Linux中通过locale来设置程序运行的不同语言环境,locale由ANSI C提供支持。locale的命名规则为<</span>语言>_<</span>地区>.<</span>字符集编码>,如zh_CN.UTF-8,zh代表中文,CN代表大陆地区,UTF-8表示字符集。在locale环境中,有一组变量,代表国际化环境中的不同设置:

  1. LC_COLLATE
    定义该环境的排序和比较规则
  2. LC_CTYPE
    用于字符分类和字符串处理,控制所有字符的处理方式,包括字符编码,字符是单字节还是多字节,如何打印等。是最重要的一个环境变量。
  3. LC_MONETARY
    货币格式
  4. LC_NUMERIC
    非货币的数字显示格式
  5. LC_TIME
    时间和日期格式
  6. LC_MESSAGES
    提示信息的语言。另外还有一个LANGUAGE参数,它与LC_MESSAGES相似,但如果该参数一旦设置,则LC_MESSAGES参数就会失效。LANGUAGE参数可同时设置多种语言信息,如LANGUANE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"。
  7. LANG
    LC_的默认值,是最低级别的设置,如果LC_没有设置,则使用该值。类似于 LC_ALL。
  8. LC_ALL
    它是一个宏,如果该值设置了,则该值会覆盖所有LC_*的设置值。注意,LANG的值不受该宏影响。
    C"是系统默认的locale,"POSIX"是"C"的别名。所以当我们新安装完一个系统时,默认的locale就是C或POSIX。

参考链接:
https://blog.csdn.net/z4213489/article/details/7937894(推荐,更为详细,通俗易懂)
http://blog.sina.com.cn/s/blog_81b27a5a0101gkqf.html

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,467评论 0 5
  • Lua 5.1 参考手册 by Roberto Ierusalimschy, Luiz Henrique de F...
    苏黎九歌阅读 13,919评论 0 38
  • 2018.5.19 星期六 阴 下午孩子上完口才课,我和孩子们一起骑自行车去超市玩,...
    宝贝涵程阅读 250评论 0 0
  • 光阴荏苒,岁月如梭,那些关于我们的酒和故事,最终随风流浪到远方,不知道,是你太过不信任,还是我太过执着,让...
    易若希寒阅读 165评论 0 0
  • 微商是由著名策划人、中国首席微商教练闻华舰先生率先提出并倡导的新型概念。微商的主要特点是在市场运作中需要非常规手段...
    仲伯夏之梦阅读 419评论 0 0