[SparkSQL] regexp_replace函数使用 去除特殊隐藏字符\n\t\r

1、函数介绍

REGEXP_REPLACE(inputString, regexString, replacementString)
第一个参数:表中字段
第二个参数:正则表达式
第三个参数:要替换称为的字符

2、使用中的坑

函数使用起来比较简单,但是也有坑,当要匹配特殊的隐藏字符\n \r \t ,等回车符、制表符时,需要通过使用\color{red}{四个 斜杠 进行转译}

sparkSession.sql(
  """
    |select
    |regexp_replace(title, '\\\\n|\\\\\t|\\\\\r', ',') title
    |from tableName
  """.stripMargin)

3、解决的问题

如果不删除这些隐藏字符,在我们导出数据写入文件时会产生异常,会在数据中间进行换行

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 概要 64学时 3.5学分 章节安排 电子商务网站概况 HTML5+CSS3 JavaScript Node 电子...
    阿啊阿吖丁阅读 13,159评论 0 3
  • 概述 正则表达式(regular expression)是一种表达文本模式(即字符串结构)的方法,有点像字符串的模...
    许先生__阅读 2,144评论 0 1
  • 第5章 引用类型(返回首页) 本章内容 使用对象 创建并操作数组 理解基本的JavaScript类型 使用基本类型...
    大学一百阅读 8,808评论 0 4
  • '^'必须才开头开始匹配'$'必须在末尾结束匹配'|' 表示‘或’/ab|cd/匹配ab或者cd'.'表示点字符(...
    zjh111阅读 3,130评论 0 0
  • JavaScript语言精粹 前言 约定:=> 表示参考相关文章或书籍; JS是JavaScript的缩写。 本书...
    微笑的AK47阅读 3,685评论 0 3

友情链接更多精彩内容