Big Data Integration

Presenter: Zou Yanyan

Challenges: 4 V

  • Volume
  • Velocity
  • Variety
  • Veracity
  1. Schema Mapping
  2. Record Linkage: blocking -> pairwise matching -> clustering
  3. Data Fusion: voting -> source quality -> copy detection
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 小艾说“如果你有女朋友了,一定要告诉我” 他说“为什么,有必要吗” 小艾说“因为,因为那样我就能死心,我就能彻底的...
    李艾青阅读 1,677评论 0 0
  • 【十年】 我不是作家也不是记者,关于人生,我只略懂一二,因为,真正读懂人生是需要很多的经历和阅历的,而我只是读懂了...
    胜者为王王臣森阅读 923评论 0 0