数据例子

1、人口库:

人员基本信息表:身份证【主键】,电话号码【option】

2、通信库

电信表: 电话号码【主键】,身份证【required】

通话记录表: from 电话号码【required】,to 电话号码【required】

邮件数据:from 邮件账户,to邮件账户

邮件账户库: 邮件账户,电话

3、组织机构库

4、入住信息库

5、出行记录库



E-R模型,拉通各个库,可以依赖

1)自然主键 

2)关系表


6、数据拉通

用户与企业的触点非常多,譬如手机、邮箱、Cookie等等。我们要将同一个用户的这些多个触点进行打通,需要站在上帝的视角。我们可以把用户ID视为图中的顶点,如果用户的两个触点在同一个场景出现,譬如用邮箱登陆,那么我们会在用户的邮箱和Cookie用一条边进行连接,从而构建一张图。

例子:拉通人员库和通信库

1)实体:

电话号码

2)事件:

打电话

3)关系:

人 -》 拥有 -》 电话号码

人 -》打电话-》人


有些情况下,相同对象生成的对象id不同。


1、数据溯源 (data provenance, trace to the source)

也叫 数据族系,数据系谱

NiFi对数据流路径上的每次变化都会保留日志记录,从而保证结果的可追溯,以及数据的恢复、重播、审计和评估



最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 22年12月更新:个人网站关停,如果仍旧对旧教程有兴趣参考 Github 的markdown内容[https://...
    tangyefei阅读 35,295评论 22 257
  • 作为最基础的常备功能, 注册/登录往往是产品第一个版本中最容易被忽视的环节,越是看似容易,陷阱越多;介绍相关产品思...
    流云妙风阅读 5,937评论 0 3
  • 昨天晚上在宿舍,没能静下心来总结。 昨天,上午,十点多起床。静帆早早起来了,一直有的奇怪的想法,别人在洗漱,我就不...
    渴望自由的羽蒙阅读 2,761评论 0 0
  • 对于耗儿鱼,原本我是拒绝的。吃火锅的时候,虽然儿子特别喜欢点上一份,但我在捞菜的时候总是远离它,绝不碰触。我...
    讲师仲夏阅读 4,134评论 1 1