数据治理与数据清洗

大数据建设中会出现数据混乱、数据重复、数据缺失等问题,就需要对非标数据进行处理,涉及到数据治理与数据清洗,常常把数据治理和数据清洗搞混,可从以下方面进行区分:


一、概念不同

数据治理主要是宏观上对数据管理,由国家或行业制定制度,更具有稳定性。数据清洗是数据在指定数据规则对混乱数据进行清洗,规则由自己设定,


数据清洗主要是微观上对数据的清洗、标准化的过程

二、处理方式

数据治理由各种行业制度,

三、角色方面

数据治理属于顶层设定、具有权威性,数据清洗由需要部门提出的,随意性比较强。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 大数据建设中会出现数据混乱、数据重复、数据等问题,就需要对非标数据进行处理,数据治理和数据清洗搞混,可从以下方面进...
    命_79f6阅读 1,641评论 0 0
  • //我所经历的大数据平台发展史(三):互联网时代 • 上篇http://www.infoq.com/cn/arti...
    葡萄喃喃呓语阅读 51,367评论 10 200
  • 图片很美轮美奂,却要在封面上挂出一幅少儿不宜的春宫图,不知意欲何为?博取众人的眼球?还是遭遇了“黑客”的恶搞?...
    河西浣女阅读 191评论 1 1
  • 今天读到硅谷吴军的文章《向死而生》以及“得到”推荐他的新书《文明之光(精华版)》推荐文,收获颇丰,其它不表单...
    吴佟阅读 479评论 0 0
  • 我是日记星球267号星宝宝,我正在参加日记星球第十三期21天蜕变之旅,这是我的第139篇原创日记。 每个人都有自己...
    张小姐4134阅读 454评论 6 4