正则表达式

符号 描述 说明
[\u4e00-\u9fa5] 中文的字符集合 但是hive在hive执行中会被转义,因此需要增加一次java的转义字符才能够正确使用[\\\u4e00-\\\u9fa5]
[a-zA-Z] 英文
[0-9] 数字
^ 字符串开始
$ 字符串结束
\ 转义
* 0次或多次
+ 1次或多次
? 0次或1次
|
{ } 表示出现次数
[ ] 表示某些字符允许在一个字符串中某一个特定位置出现
( ) 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容