业务日志服务架构简介

随着业务服务（Server App）逐渐增加，使得问题排查非常困难，很多时候需要关联查询多个服务的日志，而且统计分析十分不便。因此，急需设计一个集中式海量日志实时处理系统。需要满足功能需求（实时看日志、统计历史日志、实时行为分析、用户轨迹跟踪等）、性能需求（具有高吞吐能力、高扩展性、高容错性）等。

Kafka 是一种高吞吐量的分布式发布订阅消息系统，它适合处理海量日志发布订阅，提供消息磁盘持久化、支持物理分片存储、多组消费等特性。

Elasticsearch 是一个开源实时分布式搜索引擎，具备如下特征：零配置，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。

Flume 是Apache基金会的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，它支持在日志系统中定制各类数据发送方，用于收集数据；同时提供对数据进行简单处理，并写到各种数据接受方（可定制）。

业务日志服务架构.png

目前日志消费方式有两种：

引入Kafka的目的：

Flume 1.6增加了 KafkaSource，之前版本需要自己实现（自定义 Source 实现示例）；
Flume 做预处理和分发，需要自定义Sink（自定义Sink实现示例）；
BizLogSDK 的配置中可以添加对Kafka Producer 的配置（Producer Configs），以优化性能；
Elasticsearch 官网的 Java Client 比较重，连接数太多，建议按照Elasticsearch Reference 自己开发一个基于HTTP 协议的 Client（实现CRUD），方便业务日志按照 biztype-date 格式进行索引。注意：HTTP 连接应该复用，（可以采用HttpClient 的连接池管理方式），避免连接数过多；
Flume Sink 中拿到业务日志后，应该放到线程池里处理，避免 Flume卡死；
Elasticsearch 默认会将 string 类型字段设为 _ analyzed _，会造成CPU过高。可以通过 Elasticsearch 提供的 Index Templates 方式，在index 创建后，应用 template 到匹配的index，将相关 _ string _ 型字段设为 _ not_analyzed _。

业务App通过调用 BizLogSDK，将业务日志输出到Kafka集群。BizLogSDK 需要实现设置公用属性、扩展属性，日志发送等功能。可参考 Log4j 的源码来实现。

# 队列名称
topicName = bizlog-server
# 是否同步发送消息（异步速度更快）
send.sync = false
# kafka 消息队列服务器
bootstrap.servers = 127.0.0.1:9091

查询界面

统计界面 1

统计界面 2