大数据时代地方政府大数据治理战略

全球各地的组织正在投资于能够以先前无法想象的方式容纳和处理数据的系统。在某些情况下,企业甚至会根据这些新系统重新构建现有的IT环境。这些大数据系统产生了切实的成果:增加收入和降低成本。然而,积极的结果远未得到保证。要真正从一个人的数据中获取价值,必须对这些新平台进行管理。

数据治理一词在许多数据从业者的心中引起了恐惧。由于它经常被模糊地定义和误解,许多人只是转而采用仅限技术的方法来解决他们的治理需求。许多大数据系统带来的复杂性使得这种基于技术的方法特别具有吸引力,尽管众所周知,单靠技术很少就足够了。可能鲜为人知的是,在优化数据治理时,必须重新审视技术本身。

定义数据治理

在我们定义数据治理之前,或许了解哪些数据治理不是很有用。

数据治理不是数据沿袭,管理或主数据管理。这些术语中的每一个通常都与数据治理相结合,甚至代替数据治理。实际上,这些实践是某些组织的数据治理计划的组成部分。它们是重要的组件,但它们仅仅是组件。

数据治理的核心是正式管理整个企业的重要数据,从而确保从中获取价值。虽然成熟度水平因组织而异,但数据治理通常通过人员和流程的组合来实现,其中技术用于简化和自动化流程的各个方面。

以安全为例。即使是基本的治理级别,也需要保护企业的重要敏感数据资产。进程必须防止未经授权访问敏感数据,并将这些数据的全部或部分内容暴露给具有合法“需要知道”的用户。人们必须帮助确定谁应该或不应该访问某些类型的数据。身份管理系统和权限管理功能等技术可简化和自动化这些任务的关键方面。一些数据平台通过绑定到现有的基于用户名/密码的注册表(来进一步简化杂务,并且在分配权限时允许更大的表现力,超出POSIX模式位提供的相对较少的自由度。

我们还应该认识到,随着数据的速度和数量的增加,人类几乎不可能及时对这些数据进行分类。组织有时被迫将新数据锁定在保留单元中,直到有人对其进行适当分类并将其暴露给最终用户。有价值的时间丢失了。幸运的是,技术提供商正在开发创新方法来自动对数据进行分类,无论是直接采集还是之后不久。通过利用这些技术,满足授权过程的关键先决条件,同时最大限度地缩短洞察时间。

大数据时代的数据治理有何不同?

到目前为止,我们大多数人都熟悉大数据的三个特性:

数量:大数据系统中的数据量可达到数PB甚至更多。

多样性:数据不再只是简单的关系格式; 它可以是结构化的,半结构化的,甚至是非结构化的; 数据存储库跨文件,NoSQL表和流。

速度:数据需要从全球各地的设备中快速摄取,包括物联网来源。必须实时分析数据。

管理这些系统可能很复杂。组织通常被迫将单独的集群拼接在一起,每个集群都有自己的业务目的,或者存储和处理独特的数据类型,如文件,表或流。即使仔细地完成拼接本身,也会快速暴露间隙,因为在多个存储库中一致地保护数据集可能极易出错。

融合架构极大地简化了治理。在融合系统中,几种数据类型被集成到单个数据存储库中,可以一次性管理和保护。本身没有拼接,因为整个系统都是从同一块布上剪下来的。

除了三个V之外,还有另一个更微妙的区别。大多数大数据分布包括不同分析和机器学习引擎的合并,这些引擎位于数据存储“顶部”。这种灵活性对最终用户来说非常有用,因为他们可以选择最适合其特定分析需求的工具。从治理的角度来看,问题在于这些工具并不总是遵循相同的安全机制或协议,也不能完全,一致地记录操作,也不能在可扩展的存储库中记录,至少不是开箱即用。

因此,大数据从业者在试图满足合规性或审计师对数据沿袭的要求时可能会陷入困境,数据沿袭旨在回答问题的治理组成部分“这些数据来自何处以及发生了什么随着时间推移呢?“

基于流的数据沿袭体系结构

幸运的是,可以使用更具规范性的方法以及与大数据需求成比例扩展的系统来解决数据沿袭问题。特别是,基于流的体系结构允许组织“发布”在集群内被摄取和转换的数据。然后,消费者可以“订阅”这些数据,并以任何必要的方式填充下游系统。

现在回答基本的血统问题是一件简单的事情,例如“为什么我的结果看起来不对?” 只需使用流来回放并重放事件序列以确定出错的地方。此外,管理员甚至可以从流中重放事件,以便在下游系统损坏或发生故障时重新创建。

这可以说是解决数据沿袭问题的一种更符合法规要求的方法,但必须满足某些条件。特别:

1.流必须是不可变的

2.为所有活动的发布者和订阅者设置权限

3.审计日志设置为记录谁消耗数据以及何时消耗数据

4.流允许全局复制,如果给定站点发生故障,则允许高可用性

若想获取更多前沿互联网资讯,洞悉数据奥秘,敬请关注微信公众号——西西西语,欢迎前来讨论学习~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,753评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,668评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,090评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,010评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,054评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,806评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,484评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,380评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,873评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,021评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,158评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,838评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,499评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,044评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,159评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,449评论 3 374
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,136评论 2 356

推荐阅读更多精彩内容