利用 StreamSets 实现将 SQL Server 中数据实时同步写入 Kudu

  1. 环境准备
    1. SQL Server 中创建测试库表
      CREATE DATABASE test;
      CREATE TABLE [dbo].[cdc_test] (
        [id] int  IDENTITY(1,1) NOT NULL,
        [name] varchar(60) COLLATE Chinese_PRC_CI_AS  NOT NULL,
        CONSTRAINT [PK_cdc_test] PRIMARY KEY CLUSTERED ([id])
      WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON)  
      ON [PRIMARY]
      )  
      ON [PRIMARY]
      GO
      ALTER TABLE [dbo].[cdc_test] SET (LOCK_ESCALATION = TABLE)
      
    2. 对测试库表启用 CDC
      -- 对 test 库启用 CDC
      USE test 
      GO
      EXECUTE sys.sp_cdc_enable_db;
      GO
      -- 对 cdc_test 表启用 CDC
      USE test  
      GO  
      EXEC sys.sp_cdc_enable_table  
      @source_schema = N'dbo',  
      @source_name   = N'cdc_test',  
      @role_name     = NULL,  
      @supports_net_changes = 1  
      GO 
      

      参考: https://blog.csdn.net/weixin_43215250/article/details/105813087

    3. 在 HUE 上创建 KUDU 表
      CREATE DATABASE IF NOT EXISTS test;
      CREATE TABLE IF NOT EXISTS test.cdc_test ( 
        id int, 
        name String,
        PRIMARY key(id)
      ) 
      PARTITION BY HASH PARTITIONS 16 
      STORED AS KUDU;
      
  2. 创建 StreamSets 的 Pipline
    image

    SQL Server CDC 客户端配置

    image

    image

    image

    Stream Selector 配置

    ${record:attribute('sdc.operation.type') == 5 }
    
    image
    ${record:attribute('sdc.operation.type') == 5 }
    
    image

    Kudu 配置

    image

    image

    image

  1. 启动 Pipelines
    image
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 2017/3/14 RDBMS:关系型数据库管理系统 关系模型独立于语言 SQL有几种不同类型的语言:数据定义语言...
    ancherl阅读 1,668评论 0 6
  • 1、说明:创建数据库CREATE DATABASE database-name2、说明:删除数据库drop dat...
    sakura_L阅读 397评论 0 6
  • 环境准备开启MariaDB的Binlog日志修改/etc/my.conf文件,在配置文件[mysqld]下增加如下...
    lei_charles阅读 2,713评论 0 1
  • 基础语句 1. 创建数据库 CREATE DATABASE database_name 2. 删除数据库 drop...
    敲代码的本愿阅读 1,053评论 1 7
  • 2017年2月4日星期六,今天是春节过后的第一个工作日,在老家过年对于我来说真是一段煎熬的日子。 在家过年没有什么...
    Flc丶韩峰阅读 197评论 0 0