学习8

cleansing data

当从其他人处得到一份excel原始数据时,往往会存在一些问题,需要我们做一些处理,才能方便调用数据。常见问题如下:

  • 1.原始数据存在不能打印的字符,如何去除不能打印的字符
    clean(text)功能:消除单元格中不能打印的字符,返回可打印的文本。如下图:


    image.png
  • 2.将一个单元格中包含的信息分列显示(一般各信息间通过固定宽或者分隔符号分开)如下图


    image.png

    名字、姓氏、邮箱、职位四个信息在一个单元格内,并通过下划线分开,怎样将这四个信息分成四列显示?
    第一步:点数据下的分列选项,出现如下窗口:


    image.png

    本例中通过分隔符号“_”分开,故选分隔符号,点下一步
    image.png

本例中通过下划线分开,故选其他,并在后面空白处输入"_"(如果事先就选好了需要操作的区域,下方会显示预览),点下一步


image.png

左上方可以选择列表中数据的格式,目标区域选择需要操作的区域
,本例中是=$B$41:$B$46,点完成,结果显示如下:


image.png
  • 3.Trim function
    TRIM(text)去除文本中多余的空格,仅留下单词之间的空格,如下:


    image.png
  • 4.substitute
    =substitute(text,old_text,new_text,[instance_num])
    =substitute(需要替换的文本,旧文本,新文本,第N个旧文本)
    参数Instance_num ——为一数值,用来指定以 new_text (新文本)替换第几次出现的 old_text(旧文本)。注意第四个参数如果省略表示替换所有出现的旧文本。
    参数Instance_num 可省略,这表示用 new_text(新文本)替换掉所有的old_text(旧文本)。

    image.png

    含有逗号和空格,公式和结果如下图
    image.png

    扩展replace函数
    2.replace函数的语法格式
    =Replace(old_text,start_num,num_chars,new_text)

    =replace(要替换的字符串,开始位置,替换个数,新的文本)
    注意:第四个参数是文本,要加上引号。


    image.png
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容