云计算时代的数据集成技术

随着公有云平台和私有云平台的流行，数据集成问题越来越重要。以往存储在企业内部的信息，现在要分散在不同的公有云平台上。这些信息，要进行广泛的共享。企业内部部署的系统、公有云平台上部署的系统，彼此之间都需要共享信息。

与云计算相关的数据集成，在今天，还多是简单的数据复制，从公有云复制到企业内部系统，从公有云复制到公有云。和以往企业内部系统之间所用的传统数据复制技术没有区别。比如，企业要江SAAS 型 CRM的销售数据与企业自有数据中心的物流系统集成。数据集成软件，保证了销售数据和其它信息，能够在两个不同系统中匹配上。

云计算的快速发展，将给数据集成技术带来那些有意义的变化？传统的数据集成方法，也就是简单的数据复制和信息解析，在下面10年将成为过时的概念。为了满足云计算的需要并实现其价值，数据集成技术将在新方向上快速发展。老的数据集成市场也将被颠覆。有些数据集成技术，都已经快有20年的历史了。

忘掉过去的数据集成经验吧，新的策略、方法和技术，都将在云计算时代占据主流。

数据集成的演进

数据集成的演进，大概上开始于90年代中期，以企业应用集成为起点。为了在数据中心中 SAP和PeopleSoft之类的系统，进行信息同步。

老的数据复制集成，很好懂。从源系统中抽取信息，然后进行数据结构和数据内容的修正，再导入到目标系统中。往财务系统中添加新客户，或者更新库存状态，都会这样执行操作。

传统数据和应用集成市场的玩家，包括 Tibco， IBM, Software AG, Pervasive/Actian 和 Informatica。这些厂家中的大多数，也开始与时俱进，提供面向云计算的数据集成，或者以云计算的模式提供集成服务。但是，这些成熟的厂家提供的云计算数据集成，不一定更好，他们仅仅是早一点而已。

新的厂商包括 WSO2, Red Hat, Jitterbit, Boomi/Dell, Composite/Cisco, CASTIRON/IBM, Liaison Technologies, Scribe，还有其它很多。这些科技公司，是数据集成技术的第二波浪潮，专为了面对急剧变革中的企业数据集成需求。这一波浪潮中，出现了新的方法，例如数据虚拟化或者数据抽象（例如Red Hat, WSO2, Informatica 和 Composite/Cisco)。

在下面的途中，可以看到现在这个阶段（2010-2014）,焦点还集中于现有的集成技术，包括传统的和非传统的。所执行的任务包括：数据复制、语义解析、数据清洗、海量数据迁移。这些技术帮助企业在云－云之间，云－企业之间，或者企业－企业之间传输数据，以支持核心业务流程。过去的几年里，这些技术一直在演进以适应混合云以及多云架构，当然还要适应巨大数据集的出现（大数据）。

随着云计算技术的成熟，数据集成将呈现新的形式、扮演新的角色，并贡献新的价值。

数据在云上存储，和在非云系统上存储的方法不同。新的数据集成的功能应能够分别处理这两种存储方法，并高效进行数据结构和内容的的处理，从而让目标系统如同访问本地数据一样。海量数据迁移包括ETL（抽取－转换－加载）功能，并包括海量数据的定时迁移、内容和结构的变更，以满足目标系统，例如云数据仓库的需要。

数据清洗技术，让数据集成过程中，能够去掉或者改正错误的和不准确的数据。在数据集成的其它操作中，尤其是从一个系统传输信息到另一系统时，都需要进行数据清洗。

从上面的图可以看到，随着云计算成为企业的主流平台，数据集成的世界也需要跟进。要开拓和扩展新的能力。包括：

智能数据服务搜索

数据虚拟化

数据编排

数据标识

所谓智能数据服务搜索，指的是一种数据集成技术，能够自动发现和定义数据服务。这种技术将成为云计算和非云计算系统生产数据和消费数据的主流机制。就是说，我们可以搜寻到，或者重新搜寻到企业内部存在的数据服务。更重要的是，搜寻到公有云上的数据服务，找到数据服务的位置、提供的功能，以及如何访问这些数据服务。企业就能够利用这些编目来理解所有可用的数据资产，并利用这些有用的数据资产来支持核心业务流程。

数据虚拟化，并非一个新概念。但将会越来越受欢迎。因为企业希望利用新的虚拟化结构来重新定义现有的数据库，并把这些数据库以定义好的数据服务的形式，提供给外部。完全可以用新的虚拟数据库结构，置于现存数据库之上，从而重新定义数据库的访问方式。这样一来，就不需要冒险去重新构建后台数据库，便可以满足云计算系统的需要。

数据编排指的是，定义数据之间进行交互以形成方案的能力。和服务编排类似。定义混合的数据点，也许是销售和客户，以形成新的数据服务，来服务企业内部和外部用户。这样，使用数据的用户，将能够更好控制数据对每一应用视图的用途，而不必更改数据的物理结构和内容。

数据标识指的是，从结构和实例两个角度连接数据到用户和机器的能力。主要控制谁，以及什么系统，能够消费数据，并看到内容。这对适应各种变更和扩展的法规，以及各种内部数据安全策略，带来很大便利。数据容器控制对数据的访问，以及设置在数据中的数据标识规则。这将会是一个通用的机制，用在企业和公有云提供者之间。

想一想共享的企业业务服务诞生之后，一定会随着公有云平台上的业务系统数量而快速发展。使用服务越方便，数据的复用能力也会更强。根本不必建新的数据库，或者数据服务实例，人们只需要从结构和内容上，对现有系统的数据进行重新利用即可。这种能力一定会发展起来。比方说，可以从另一个企业提供的数据，形成历史销售数据库，对一个新建的系统提供欺诈模型。用户并不需要理解复用的数据集的实际细节。在复用的时候，数据已经重新进行自我定义了。

和数据标识类似，身份识别和集中信用也是控制数据访问权限机制的新一代技术。通过提供集中化的位置去验证数据（结构和内容），验证要访问和操作数据的用户和设备，把数据标识提高到另一个层次。这种机制意味着我们能够了解数据存放的位置，并将授权用户匹配到授权的数据，从数据库、对象到实例。再次强调，这种方法预设了一种通用的标准。

预测从来就不是科学。但很肯定的是，5年内，数据集成技术的市场将发生巨大变化。

最后编辑于：2017.11.27 04:31:53

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,907评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,987评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,298评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,586评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,633评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,488评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,275评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,176评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,619评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,819评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,932评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,655评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,265评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,871评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,994评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,095评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,884评论 2赞 354

云计算时代的数据集成技术

推荐阅读更多精彩内容