1、人口库:
人员基本信息表:身份证【主键】,电话号码【option】
2、通信库
电信表: 电话号码【主键】,身份证【required】
通话记录表: from 电话号码【required】,to 电话号码【required】
邮件数据:from 邮件账户,to邮件账户
邮件账户库: 邮件账户,电话
3、组织机构库
4、入住信息库
5、出行记录库
E-R模型,拉通各个库,可以依赖
1)自然主键
2)关系表
6、数据拉通
用户与企业的触点非常多,譬如手机、邮箱、Cookie等等。我们要将同一个用户的这些多个触点进行打通,需要站在上帝的视角。我们可以把用户ID视为图中的顶点,如果用户的两个触点在同一个场景出现,譬如用邮箱登陆,那么我们会在用户的邮箱和Cookie用一条边进行连接,从而构建一张图。
例子:拉通人员库和通信库
1)实体:
电话号码
人
2)事件:
打电话
3)关系:
人 -》 拥有 -》 电话号码
人 -》打电话-》人
有些情况下,相同对象生成的对象id不同。
1、数据溯源 (data provenance, trace to the source)
也叫 数据族系,数据系谱
NiFi对数据流路径上的每次变化都会保留日志记录,从而保证结果的可追溯,以及数据的恢复、重播、审计和评估