Flume 监听Avro客户端 输出到Kafka

前言:

本文章适用于在Windows上使用Flume 监听Avro Client,模拟数据库表的增量同步到Kafka中。首先确保你的flume-ng可以启动,跳过个别步骤可自行百度。

1、MySQL创建表:

DROP TABLE IF EXISTS `avro`;
CREATE TABLE `avro` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL,
  `createdt` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=latin1;

INSERT INTO `avro` VALUES ('1', 'a', '2018-11-21 04:00:00');
INSERT INTO `avro` VALUES ('2', 'b', '2018-11-22 05:00:00');
INSERT INTO `avro` VALUES ('3', 'c', '2018-11-23 06:00:00');
INSERT INTO `avro` VALUES ('4', 'd', '2018-11-24 07:00:00');
INSERT INTO `avro` VALUES ('5', 'e', '2018-11-25 08:00:00');
INSERT INTO `avro` VALUES ('6', 'f', '2018-11-26 09:00:00');
INSERT INTO `avro` VALUES ('7', 'g', '2018-11-27 10:00:00');
INSERT INTO `avro` VALUES ('8', 'h', '2018-11-28 11:00:00');
INSERT INTO `avro` VALUES ('9', 'i', '2018-11-29 12:00:00');
INSERT INTO `avro` VALUES ('10', 'j', '2018-11-30 13:56:41');

avro表如图


image.png

2、Avro 的官网实例

2.1、创建Flume Avro Client :(Thrift 同理)

可参见Flume官网实例

打开Eclipse 右击
src/main/java 新建一个package org.flume.avro
新建Class MyApp.java

package org.flume.avro;

import org.apache.flume.Event;
import org.apache.flume.EventDeliveryException;
import org.apache.flume.api.RpcClient;
import org.apache.flume.api.RpcClientFactory;
import org.apache.flume.event.EventBuilder;
import java.nio.charset.Charset;

public class MyApp {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        MyRpcClientFacade client = new MyRpcClientFacade();
        // Initialize client with the remote Flume agent's host and port
        //端口与avro.conf a1.sources.r1.port一致     
        client.init("localhost", 41414);        
        String sampleData = "Hello Flume!";
        for (int i = 0; i < 5; i++) {
          client.sendDataToFlume(sampleData+" " + i);
        }   
        System.out.println("输出完毕");
        client.cleanUp();
      } 
    }
    
class MyRpcClientFacade {
      private RpcClient client;
      private String hostname;
      private int port;

      public void init(String hostname, int port) {
        // Setup the RPC connection
        this.hostname = hostname;
        this.port = port;
        this.client = RpcClientFactory.getDefaultInstance(hostname, port);      //创建avro客户端
        // Use the following method to create a thrift client (instead of the above line):
        // this.client = RpcClientFactory.getThriftInstance(hostname, port);    //创建Thrift客户端
      }

      public void sendDataToFlume(String data) {
        // Create a Flume Event object that encapsulates the sample data
        // 调用EventBuilder重载的withBody()方法。
        Event event = EventBuilder.withBody(data, Charset.forName("UTF-8"));        
        try {
          client.append(event);     // Send the event 发送数据
        } catch (EventDeliveryException e) {
          // clean up and recreate the client 清理并重新创建客户端
          client.close();
          client = null;
          client = RpcClientFactory.getDefaultInstance(hostname, port);
          // Use the following method to create a thrift client (instead of the above line):
          // this.client = RpcClientFactory.getThriftInstance(hostname, port);
        }
      }

      public void cleanUp() {
        // Close the RPC connection
        client.close();
      }   
}

2.2、配置conf

Flume的conf目录新建 avro.conf

a1.channels = c1
a1.sources = r1
a1.sinks = k1

a1.sources.r1.type = avro
a1.sources.r1.bind = 0.0.0.0
a1.sources.r1.port = 41414    //端口与MyApp.java中的port一致

a1.channels.c1.type = memory

a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.topic = avrosrc
a1.sinks.k1.brokerList = localhost:9092
a1.sinks.k1.requiredAcks = 1
a1.sinks.k1.batchSize = 20

a1.sinks.k1.channel = c1
a1.sources.r1.channels = c1

2.3、输出到Kafka

此处省略Kafka启动步骤,详见链接
新建Kafka Topic avrosrc

kafka-run-class.bat kafka.admin.TopicCommand --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic avrosrc

查看Topic avrosrc(此时为空)

kafka-console-consumer.bat --bootstrap-server localhost:9092 --topic avrosrc --from-beginning

启动flume-ng

D:\com\apache-flume-1.8.0-bin>flume-ng agent -c conf -f conf/avro.conf -n a1 -property "flume.root.logger=INFO,console"

Eclipse 运行 MyApp.java(右键 → Run As → Java Application)
此时观察 Topic 有数据进入


image.png

3、Avro 自定义

每秒随机读取数据库avro表的一条数据,并输出到Kafka,模拟增量数据
修改 MyApp.java

package org.flume.avro;

import org.apache.flume.Event;
import org.apache.flume.EventDeliveryException;
import org.apache.flume.api.RpcClient;
import org.apache.flume.api.RpcClientFactory;
import org.apache.flume.event.EventBuilder;

import java.nio.charset.Charset;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;
import java.sql.Timestamp;

public class MyApp {
    
    static final String DB_URL = "jdbc:mysql://localhost:3306/***";  //输入DB名称
    static final String USER = "***";      //DB用户名
    static final String PASS = "***";    //DB密码
    
    public static void main(String[] args) {
        // TODO Auto-generated method stub
        MyRpcClientFacade client = new MyRpcClientFacade();     
        client.init("localhost", 41414);
        Connection conn = null;
        Statement stmt = null;    //真实场景使用PreparedStatement防止SQL注入
        try{            
            Class.forName("com.mysql.jdbc.Driver");                 // 注册 JDBC 驱动               
            conn = DriverManager.getConnection(DB_URL,USER,PASS);   // 打开链接   
            client.sendDataToFlume("Connect to db");         
            stmt = conn.createStatement();                          // 执行查询
            for(int i = 0;i < 10;i++){
                int index = (int)(Math.random()*10) + 1;
                String sql = "SELECT * FROM avro where id=" + index; 
                ResultSet rs = stmt.executeQuery(sql);              // 保存到结果集
                while(rs.next()){
                    int id  = rs.getInt("id");
                    String name = rs.getString("name");
                    Timestamp createdt = rs.getTimestamp("createdt");
                    System.out.print("ID: " + id);
                    System.out.print(", 名称: " + name);
                    System.out.print(", 创建时间: " + createdt);
                    System.out.print("\n");
                     //client.sendDataToFlume 发送数据!
                    client.sendDataToFlume("id: " + id + ", name: " + name + ", createdt: " + createdt);   
                }
                rs.close();
                try {
                    Thread.sleep(1000);     //等待一秒,模拟增量场景
                } catch (InterruptedException e) {
                    e.printStackTrace(); 
                }
            }            
            stmt.close();
            conn.close();
        }catch(SQLException se){  // 处理 JDBC 错误            
            se.printStackTrace();
        }catch(Exception e){  // 处理 Class.forName 错误            
            e.printStackTrace();
        }finally{  // 关闭资源            
            try{
                if(stmt!=null) stmt.close();
            }catch(SQLException se2){
            }
            try{
                if(conn!=null) conn.close();
            }catch(SQLException se){
                se.printStackTrace();
            }
        }
        client.sendDataToFlume("avro结束");    //测试中文是否乱码:是
        client.sendDataToFlume("avro over");
        System.out.println("avro结束");
        client.cleanUp();
      } 
    }
    
class MyRpcClientFacade {
      private RpcClient client;
      private String hostname;
      private int port;

      public void init(String hostname, int port) {
        // Setup the RPC connection
        this.hostname = hostname;
        this.port = port;
        this.client = RpcClientFactory.getDefaultInstance(hostname, port);      //创建avro客户端
        // Use the following method to create a thrift client (instead of the above line):
        // this.client = RpcClientFactory.getThriftInstance(hostname, port);    //创建Thrift客户端
      }

      public void sendDataToFlume(String data) {
        // Create a Flume Event object that encapsulates the sample data
        // 调用EventBuilder重载的withBody()方法。
        Event event = EventBuilder.withBody(data, Charset.forName("UTF-8"));        
        try {
          client.append(event);     // Send the event 发送数据
        } catch (EventDeliveryException e) {
          // clean up and recreate the client 清理并重新创建客户端
          client.close();
          client = null;
          client = RpcClientFactory.getDefaultInstance(hostname, port);
          // Use the following method to create a thrift client (instead of the above line):
          // this.client = RpcClientFactory.getThriftInstance(hostname, port);
        }
      }

      public void cleanUp() {
        // Close the RPC connection
        client.close();
      }

}

再次运行 MyApp.java
随机读取表中10条数据(每秒一条),输出到Kafka


image.png

至此完成在Windows环境下使用Flume 监听Avro Client并输出到Kafka中!

谢谢阅读,有帮助的点个❤!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容