Kafka核心原理（九）：企业级实战案例

前言

理论结合实践是掌握 Kafka 的最佳方式。本章将通过企业级实战案例，深入探讨 Kafka 在实际业务场景中的应用，帮助你将理论知识转化为实际能力。

实时数据处理平台

架构设计

┌─────────────────────────────────────────────────────────────────────────┐
│                    实时数据处理平台架构                                  │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│  数据源层              消息层              处理层              存储层   │
│                                                                         │
│  ┌─────────┐                                                      │    │
│  │ 用户行为 │───┐                                                │    │
│  └─────────┘   │                                                │    │
│                │    ┌─────────────────────────────┐            │    │
│  ┌─────────┐   │    │                             │            │    │
│  │ 应用日志 │───┼───►│        Kafka Cluster        │───┐        │    │
│  └─────────┘   │    │      (实时数据管道)          │   │        │    │
│                │    │                             │   │        │    │
│  ┌─────────┐   │    │  ┌─────┐ ┌─────┐ ┌─────┐  │   │        │    │
│  │ 数据库   │───┘    │  │ B1  │ │ B2  │ │ B3  │  │   │        │    │
│  │ CDC     │        │  └─────┘ └─────┘ └─────┘  │   │        │    │
│  └─────────┘        └─────────────────────────────┘   │        │    │
│                                                       │        │    │
│                                          ┌────────────┼────────┐    │
│                                          │            │        │    │
│                                          ▼            ▼        ▼    │
│                                   ┌──────────┐ ┌──────────┐ ┌─────┐ │
│                                   │ Flink    │ │ Spark    │ │实时 │ │
│                                   │ Streaming│ │ Streaming│ │ETL  │ │
│                                   └────┬─────┘ └────┬─────┘ └──┬──┘ │
│                                        │            │          │    │
│                                        └────────────┼──────────┘    │
│                                                     │               │
│                          ┌──────────────────────────┼───────────────┤
│                          │                          │               │
│                          ▼                          ▼               ▼    │
│                   ┌──────────┐              ┌──────────┐    ┌─────────┐│
│                   │ ClickHouse│              │  Redis   │    │  ES     ││
│                   │ (实时分析)│              │ (缓存)   │    │(日志)   ││
│                   └──────────┘              └──────────┘    └─────────┘│
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘

实时用户行为分析

// 用户行为事件生产者
public class UserBehaviorProducer {
    
    private final KafkaProducer<String, UserBehavior> producer;
    private final String topic = "user-behaviors";
    
    public void sendBehavior(UserBehavior behavior) {
        // 使用用户ID作为Key，保证同一用户行为顺序
        String key = behavior.getUserId();
        
        ProducerRecord<String, UserBehavior> record = 
            new ProducerRecord<>(topic, key, behavior);
        
        producer.send(record, (metadata, exception) -> {
            if (exception != null) {
                log.error("Failed to send behavior: {}", behavior, exception);
                // 存入失败队列重试
                deadLetterQueue.offer(behavior);
            }
        });
    }
}

// Flink 实时处理作业
public class UserBehaviorAnalysisJob {
    
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = 
            StreamExecutionEnvironment.getExecutionEnvironment();
        
        // Kafka Source
        KafkaSource<UserBehavior> source = KafkaSource.<UserBehavior>builder()
            .setBootstrapServers("kafka:9092")
            .setTopics("user-behaviors")
            .setGroupId("behavior-analyzer")
            .setStartingOffsets(OffsetsInitializer.earliest())
            .setValueOnlyDeserializer(new UserBehaviorDeserializer())
            .build();
        
        DataStream<UserBehavior> behaviors = env.fromSource(
            source, WatermarkStrategy.noWatermarks(), "Kafka Source"
        );
        
        // 实时统计用户行为
        behaviors
            .keyBy(UserBehavior::getUserId)
            .window(TumblingEventTimeWindows.of(Time.minutes(5)))
            .aggregate(new BehaviorCountAggregator())
            .addSink(new ClickHouseSink());
        
        // 实时检测异常行为
        behaviors
            .keyBy(UserBehavior::getUserId)
            .process(new AbnormalBehaviorDetector())
            .addSink(new AlertSink());
        
        env.execute("User Behavior Analysis");
    }
}

// 行为计数聚合器
public class BehaviorCountAggregator 
        implements AggregateFunction<UserBehavior, BehaviorCount, BehaviorCount> {
    
    @Override
    public BehaviorCount createAccumulator() {
        return new BehaviorCount();
    }
    
    @Override
    public BehaviorCount add(UserBehavior behavior, BehaviorCount acc) {
        acc.setUserId(behavior.getUserId());
        acc.increment(behavior.getType());
        acc.setWindowEnd(System.currentTimeMillis());
        return acc;
    }
    
    @Override
    public BehaviorCount getResult(BehaviorCount acc) {
        return acc;
    }
    
    @Override
    public BehaviorCount merge(BehaviorCount a, BehaviorCount b) {
        a.merge(b);
        return a;
    }
}
// 用户行为事件生产者
public class UserBehaviorProducer {
    
    private final KafkaProducer<String, UserBehavior> producer;
    private final String topic = "user-behaviors";
    
    public void sendBehavior(UserBehavior behavior) {
        // 使用用户ID作为Key，保证同一用户行为顺序
        String key = behavior.getUserId();
        
        ProducerRecord<String, UserBehavior> record = 
            new ProducerRecord<>(topic, key, behavior);
        
        producer.send(record, (metadata, exception) -> {
            if (exception != null) {
                log.error("Failed to send behavior: {}", behavior, exception);
                // 存入失败队列重试
                deadLetterQueue.offer(behavior);
            }
        });
    }
}

// Flink 实时处理作业
public class UserBehaviorAnalysisJob {
    
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = 
            StreamExecutionEnvironment.getExecutionEnvironment();
        
        // Kafka Source
        KafkaSource<UserBehavior> source = KafkaSource.<UserBehavior>builder()
            .setBootstrapServers("kafka:9092")
            .setTopics("user-behaviors")
            .setGroupId("behavior-analyzer")
            .setStartingOffsets(OffsetsInitializer.earliest())
            .setValueOnlyDeserializer(new UserBehaviorDeserializer())
            .build();
        
        DataStream<UserBehavior> behaviors = env.fromSource(
            source, WatermarkStrategy.noWatermarks(), "Kafka Source"
        );
        
        // 实时统计用户行为
        behaviors
            .keyBy(UserBehavior::getUserId)
            .window(TumblingEventTimeWindows.of(Time.minutes(5)))
            .aggregate(new BehaviorCountAggregator())
            .addSink(new ClickHouseSink());
        
        // 实时检测异常行为
        behaviors
            .keyBy(UserBehavior::getUserId)
            .process(new AbnormalBehaviorDetector())
            .addSink(new AlertSink());
        
        env.execute("User Behavior Analysis");
    }
}

// 行为计数聚合器
public class BehaviorCountAggregator 
        implements AggregateFunction<UserBehavior, BehaviorCount, BehaviorCount> {
    
    @Override
    public BehaviorCount createAccumulator() {
        return new BehaviorCount();
    }
    
    @Override
    public BehaviorCount add(UserBehavior behavior, BehaviorCount acc) {
        acc.setUserId(behavior.getUserId());
        acc.increment(behavior.getType());
        acc.setWindowEnd(System.currentTimeMillis());
        return acc;
    }
    
    @Override
    public BehaviorCount getResult(BehaviorCount acc) {
        return acc;
    }
    
    @Override
    public BehaviorCount merge(BehaviorCount a, BehaviorCount b) {
        a.merge(b);
        return a;
    }
}

实时推荐系统

┌─────────────────────────────────────────────────────────────────────────┐
│                    实时推荐系统架构                                      │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│  用户行为 → Kafka → 实时特征计算 → 推荐服务 → 用户                     │
│                                                                         │
│  详细流程：                                                              │
│  ┌────────────────────────────────────────────────────────────────┐    │
│  │                                                                 │    │
│  │  1. 用户浏览商品 A                                              │    │
│  │     └── 事件发送到 Kafka (user-behaviors 主题)                  │    │
│  │                                                                 │    │
│  │  2. 实时特征计算                                                │    │
│  │     ├── 提取用户兴趣特征                                        │    │
│  │     ├── 更新用户画像                                            │    │
│  │     └── 存储到 Redis                                            │    │
│  │                                                                 │    │
│  │  3. 推荐服务                                                    │    │
│  │     ├── 获取用户实时特征                                        │    │
│  │     ├── 调用推荐模型                                            │    │
│  │     └── 返回推荐结果                                            │    │
│  │                                                                 │    │
│  │  4. 推荐结果存储                                                │    │
│  │     └── 发送到 Kafka (recommendations 主题)                     │    │
│  │                                                                 │    │
│  └────────────────────────────────────────────────────────────────┘    │
│                                                                         │
│  Topic 设计：                                                            │
│  ├── user-behaviors        # 用户行为事件                              │
│  ├── user-profiles         # 用户画像更新                              │
│  ├── recommendations       # 推荐结果                                  │
│  └── recommendation-feedback # 推荐反馈                                │
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘

事件溯源与 CQRS

架构设计

┌─────────────────────────────────────────────────────────────────────────┐
│                    CQRS + 事件溯源架构                                   │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│                          Command Side                                   │
│                    ┌─────────────────────────┐                         │
│                    │      Command API        │                         │
│                    └───────────┬─────────────┘                         │
│                                │                                        │
│                                ▼                                        │
│                    ┌─────────────────────────┐                         │
│                    │     Command Handler     │                         │
│                    │    (业务逻辑验证)        │                         │
│                    └───────────┬─────────────┘                         │
│                                │                                        │
│                                ▼                                        │
│                    ┌─────────────────────────┐                         │
│                    │       Event Store       │                         │
│                    │       (Kafka)           │                         │
│                    │  ┌───────────────────┐  │                         │
│                    │  │ order-events      │  │                         │
│                    │  │ payment-events    │  │                         │
│                    │  │ inventory-events  │  │                         │
│                    │  └───────────────────┘  │                         │
│                    └───────────┬─────────────┘                         │
│                                │                                        │
│          ┌─────────────────────┼─────────────────────┐                 │
│          │                     │                     │                 │
│          ▼                     ▼                     ▼                 │
│  ┌───────────────┐   ┌───────────────┐   ┌───────────────┐            │
│  │ Order         │   │ Payment       │   │ Inventory     │            │
│  │ Projection    │   │ Projection    │   │ Projection    │            │
│  └───────┬───────┘   └───────┬───────┘   └───────┬───────┘            │
│          │                   │                   │                     │
│          ▼                   ▼                   ▼                     │
│  ┌───────────────┐   ┌───────────────┐   ┌───────────────┐            │
│  │ Order DB      │   │ Payment DB    │   │ Inventory DB  │            │
│  │ (读模型)      │   │ (读模型)      │   │ (读模型)      │            │
│  └───────────────┘   └───────────────┘   └───────────────┘            │
│          │                   │                   │                     │
│          └───────────────────┼───────────────────┘                     │
│                              │                                          │
│                              ▼                                          │
│                    ┌─────────────────────────┐                         │
│                    │       Query API         │                         │
│                    │      (查询服务)          │                         │
│                    └─────────────────────────┘                         │
│                                                                         │
│                          Query Side                                     │
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘

订单系统实现

// 事件定义
public sealed interface OrderEvent {
    String getOrderId();
    Instant getTimestamp();
}

public record OrderCreated(
    String orderId,
    String userId,
    List<OrderItem> items,
    Instant timestamp
) implements OrderEvent {}

public record OrderPaid(
    String orderId,
    String paymentId,
    BigDecimal amount,
    Instant timestamp
) implements OrderEvent {}

public record OrderShipped(
    String orderId,
    String trackingNumber,
    Instant timestamp
) implements OrderEvent {}

public record OrderCompleted(
    String orderId,
    Instant timestamp
) implements OrderEvent {}

// 聚合根 - 订单
public class Order {
    private String orderId;
    private String userId;
    private OrderStatus status;
    private List<OrderItem> items;
    private List<OrderEvent> pendingEvents = new ArrayList<>();
    
    // 创建订单
    public static Order create(String orderId, String userId, List<OrderItem> items) {
        Order order = new Order();
        OrderCreated event = new OrderCreated(orderId, userId, items, Instant.now());
        order.apply(event);
        order.pendingEvents.add(event);
        return order;
    }
    
    // 支付订单
    public void pay(String paymentId, BigDecimal amount) {
        if (status != OrderStatus.CREATED) {
            throw new IllegalStateException("Order cannot be paid in current status");
        }
        OrderPaid event = new OrderPaid(orderId, paymentId, amount, Instant.now());
        apply(event);
        pendingEvents.add(event);
    }
    
    // 发货
    public void ship(String trackingNumber) {
        if (status != OrderStatus.PAID) {
            throw new IllegalStateException("Order cannot be shipped in current status");
        }
        OrderShipped event = new OrderShipped(orderId, trackingNumber, Instant.now());
        apply(event);
        pendingEvents.add(event);
    }
    
    // 应用事件（状态变更）
    private void apply(OrderEvent event) {
        switch (event) {
            case OrderCreated e -> {
                this.orderId = e.orderId();
                this.userId = e.userId();
                this.items = e.items();
                this.status = OrderStatus.CREATED;
            }
            case OrderPaid e -> this.status = OrderStatus.PAID;
            case OrderShipped e -> this.status = OrderStatus.SHIPPED;
            case OrderCompleted e -> this.status = OrderStatus.COMPLETED;
        }
    }
    
    public List<OrderEvent> getPendingEvents() {
        return new ArrayList<>(pendingEvents);
    }
    
    public void clearPendingEvents() {
        pendingEvents.clear();
    }
}

// 事件存储服务
public class EventStoreService {
    
    private final KafkaProducer<String, OrderEvent> producer;
    private final String topic = "order-events";
    
    public void saveEvents(String orderId, List<OrderEvent> events) {
        for (OrderEvent event : events) {
            ProducerRecord<String, OrderEvent> record = 
                new ProducerRecord<>(topic, orderId, event);
            producer.send(record);
        }
        producer.flush();
    }
    
    public List<OrderEvent> loadEvents(String orderId) {
        // 从 Kafka 读取所有事件
        List<OrderEvent> events = new ArrayList<>();
        try (KafkaConsumer<String, OrderEvent> consumer = createConsumer()) {
            consumer.assign(Collections.singletonList(
                new TopicPartition(topic, getPartition(orderId))
            ));
            consumer.seekToBeginning(Collections.emptyList());
            
            ConsumerRecords<String, OrderEvent> records;
            do {
                records = consumer.poll(Duration.ofMillis(100));
                for (ConsumerRecord<String, OrderEvent> record : records) {
                    if (record.key().equals(orderId)) {
                        events.add(record.value());
                    }
                }
            } while (!records.isEmpty());
        }
        return events;
    }
}

// 投影服务 - 构建读模型
public class OrderProjectionService {
    
    @KafkaListener(topics = "order-events", groupId = "order-projection")
    public void handleEvent(OrderEvent event) {
        switch (event) {
            case OrderCreated e -> {
                OrderReadModel order = new OrderReadModel();
                order.setOrderId(e.orderId());
                order.setUserId(e.userId());
                order.setItems(e.items());
                order.setStatus("CREATED");
                order.setCreatedAt(e.timestamp());
                orderRepository.save(order);
            }
            case OrderPaid e -> {
                orderRepository.updateStatus(e.orderId(), "PAID");
                orderRepository.updatePaymentId(e.orderId(), e.paymentId());
            }
            case OrderShipped e -> {
                orderRepository.updateStatus(e.orderId(), "SHIPPED");
                orderRepository.updateTrackingNumber(e.orderId(), e.trackingNumber());
            }
            case OrderCompleted e -> {
                orderRepository.updateStatus(e.orderId(), "COMPLETED");
            }
        }
    }
}
// 事件定义
public sealed interface OrderEvent {
    String getOrderId();
    Instant getTimestamp();
}

public record OrderCreated(
    String orderId,
    String userId,
    List<OrderItem> items,
    Instant timestamp
) implements OrderEvent {}

public record OrderPaid(
    String orderId,
    String paymentId,
    BigDecimal amount,
    Instant timestamp
) implements OrderEvent {}

public record OrderShipped(
    String orderId,
    String trackingNumber,
    Instant timestamp
) implements OrderEvent {}

public record OrderCompleted(
    String orderId,
    Instant timestamp
) implements OrderEvent {}

// 聚合根 - 订单
public class Order {
    private String orderId;
    private String userId;
    private OrderStatus status;
    private List<OrderItem> items;
    private List<OrderEvent> pendingEvents = new ArrayList<>();
    
    // 创建订单
    public static Order create(String orderId, String userId, List<OrderItem> items) {
        Order order = new Order();
        OrderCreated event = new OrderCreated(orderId, userId, items, Instant.now());
        order.apply(event);
        order.pendingEvents.add(event);
        return order;
    }
    
    // 支付订单
    public void pay(String paymentId, BigDecimal amount) {
        if (status != OrderStatus.CREATED) {
            throw new IllegalStateException("Order cannot be paid in current status");
        }
        OrderPaid event = new OrderPaid(orderId, paymentId, amount, Instant.now());
        apply(event);
        pendingEvents.add(event);
    }
    
    // 发货
    public void ship(String trackingNumber) {
        if (status != OrderStatus.PAID) {
            throw new IllegalStateException("Order cannot be shipped in current status");
        }
        OrderShipped event = new OrderShipped(orderId, trackingNumber, Instant.now());
        apply(event);
        pendingEvents.add(event);
    }
    
    // 应用事件（状态变更）
    private void apply(OrderEvent event) {
        switch (event) {
            case OrderCreated e -> {
                this.orderId = e.orderId();
                this.userId = e.userId();
                this.items = e.items();
                this.status = OrderStatus.CREATED;
            }
            case OrderPaid e -> this.status = OrderStatus.PAID;
            case OrderShipped e -> this.status = OrderStatus.SHIPPED;
            case OrderCompleted e -> this.status = OrderStatus.COMPLETED;
        }
    }
    
    public List<OrderEvent> getPendingEvents() {
        return new ArrayList<>(pendingEvents);
    }
    
    public void clearPendingEvents() {
        pendingEvents.clear();
    }
}

// 事件存储服务
public class EventStoreService {
    
    private final KafkaProducer<String, OrderEvent> producer;
    private final String topic = "order-events";
    
    public void saveEvents(String orderId, List<OrderEvent> events) {
        for (OrderEvent event : events) {
            ProducerRecord<String, OrderEvent> record = 
                new ProducerRecord<>(topic, orderId, event);
            producer.send(record);
        }
        producer.flush();
    }
    
    public List<OrderEvent> loadEvents(String orderId) {
        // 从 Kafka 读取所有事件
        List<OrderEvent> events = new ArrayList<>();
        try (KafkaConsumer<String, OrderEvent> consumer = createConsumer()) {
            consumer.assign(Collections.singletonList(
                new TopicPartition(topic, getPartition(orderId))
            ));
            consumer.seekToBeginning(Collections.emptyList());
            
            ConsumerRecords<String, OrderEvent> records;
            do {
                records = consumer.poll(Duration.ofMillis(100));
                for (ConsumerRecord<String, OrderEvent> record : records) {
                    if (record.key().equals(orderId)) {
                        events.add(record.value());
                    }
                }
            } while (!records.isEmpty());
        }
        return events;
    }
}

// 投影服务 - 构建读模型
public class OrderProjectionService {
    
    @KafkaListener(topics = "order-events", groupId = "order-projection")
    public void handleEvent(OrderEvent event) {
        switch (event) {
            case OrderCreated e -> {
                OrderReadModel order = new OrderReadModel();
                order.setOrderId(e.orderId());
                order.setUserId(e.userId());
                order.setItems(e.items());
                order.setStatus("CREATED");
                order.setCreatedAt(e.timestamp());
                orderRepository.save(order);
            }
            case OrderPaid e -> {
                orderRepository.updateStatus(e.orderId(), "PAID");
                orderRepository.updatePaymentId(e.orderId(), e.paymentId());
            }
            case OrderShipped e -> {
                orderRepository.updateStatus(e.orderId(), "SHIPPED");
                orderRepository.updateTrackingNumber(e.orderId(), e.trackingNumber());
            }
            case OrderCompleted e -> {
                orderRepository.updateStatus(e.orderId(), "COMPLETED");
            }
        }
    }
}

日志收集与分析

架构设计

┌─────────────────────────────────────────────────────────────────────────┐
│                    日志收集与分析架构                                    │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│  应用层                    传输层                 存储分析层            │
│                                                                         │
│  ┌──────────┐                                                      │    │
│  │ App 1    │──┐                                                   │    │
│  │ (Logback)│  │                                                   │    │
│  └──────────┘  │    ┌─────────────────────────────┐              │    │
│                │    │                             │              │    │
│  ┌──────────┐  │    │        Kafka Cluster        │              │    │
│  │ App 2    │──┼───►│      (日志数据管道)          │───┐          │    │
│  │ (Log4j2) │  │    │                             │   │          │    │
│  └──────────┘  │    │  Topic 设计：               │   │          │    │
│                │    │  ├── app-logs               │   │          │    │
│  ┌──────────┐  │    │  ├── access-logs            │   │          │    │
│  │ App 3    │──┘    │  ├── error-logs             │   │          │    │
│  │ (JSON)   │       │  └── metrics-logs           │   │          │    │
│  └──────────┘       └─────────────────────────────┘   │          │    │
│                                                      │          │    │
│                                          ┌───────────┼──────────┐    │
│                                          │           │          │    │
│                                          ▼           ▼          ▼    │
│                                   ┌──────────┐┌──────────┐┌─────────┐│
│                                   │  Kafka   ││  Flink   ││  Kafka  ││
│                                   │ Connect  ││Streaming ││ Streams ││
│                                   └────┬─────┘└────┬─────┘└────┬────┘│
│                                        │           │           │      │
│                          ┌─────────────┼───────────┼───────────┤      │
│                          │             │           │           │      │
│                          ▼             ▼           ▼           ▼      │
│                   ┌──────────┐  ┌──────────┐ ┌──────────┐ ┌─────────┐│
│                   │ Elastic  │  │ ClickHouse│ │   HDFS   │ │  Redis  ││
│                   │ Search   │  │           │ │   (归档) │ │ (实时)  ││
│                   └──────────┘  └──────────┘ └──────────┘ └─────────┘│
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘

日志生产者配置

<!-- Logback Kafka Appender -->
<appender name="KAFKA" class="com.github.danielwegener.logback.kafka.KafkaAppender">
    <encoder class="net.logstash.logback.encoder.LogstashEncoder">
        <customFields>{"app":"order-service","env":"prod"}</customFields>
    </encoder>
    <topic>app-logs</topic>
    <keyingStrategy class="com.github.danielwegener.logback.kafka.keying.RoundRobinKeyingStrategy"/>
    <deliveryStrategy class="com.github.danielwegener.logback.kafka.delivery.AsynchronousDeliveryStrategy"/>
    <producerConfig>bootstrap.servers=kafka1:9092,kafka2:9092,kafka3:9092</producerConfig>
    <producerConfig>acks=all</producerConfig>
    <producerConfig>retries=3</producerConfig>
    <producerConfig>compression.type=lz4</producerConfig>
</appender>

<root level="INFO">
    <appender-ref ref="KAFKA"/>
</root>
<!-- Logback Kafka Appender -->
<appender name="KAFKA" class="com.github.danielwegener.logback.kafka.KafkaAppender">
    <encoder class="net.logstash.logback.encoder.LogstashEncoder">
        <customFields>{"app":"order-service","env":"prod"}</customFields>
    </encoder>
    <topic>app-logs</topic>
    <keyingStrategy class="com.github.danielwegener.logback.kafka.keying.RoundRobinKeyingStrategy"/>
    <deliveryStrategy class="com.github.danielwegener.logback.kafka.delivery.AsynchronousDeliveryStrategy"/>
    <producerConfig>bootstrap.servers=kafka1:9092,kafka2:9092,kafka3:9092</producerConfig>
    <producerConfig>acks=all</producerConfig>
    <producerConfig>retries=3</producerConfig>
    <producerConfig>compression.type=lz4</producerConfig>
</appender>

<root level="INFO">
    <appender-ref ref="KAFKA"/>
</root>

日志分析示例

// 使用 Kafka Streams 进行实时日志分析
public class LogAnalysisStream {
    
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put(StreamsConfig.APPLICATION_ID_CONFIG, "log-analysis");
        props.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG, "kafka:9092");
        
        StreamsBuilder builder = new StreamsBuilder();
        
        // 1. 错误日志统计
        KStream<String, String> logs = builder.stream("app-logs");
        
        logs.filter((key, value) -> value.contains("\"level\":\"ERROR\""))
            .groupBy((key, value) -> extractService(value))
            .count(Materialized.as("error-count-by-service"));
        
        // 2. 慢请求检测
        logs.filter((key, value) -> {
                long duration = extractDuration(value);
                return duration > 1000; // 超过1秒
            })
            .map((key, value) -> new KeyValue<>(extractTraceId(value), value))
            .to("slow-requests");
        
        // 3. 错误率监控
        logs.groupBy((key, value) -> extractService(value))
            .aggregate(
                () -> new ErrorStats(),
                (key, value, stats) -> {
                    stats.incrementTotal();
                    if (value.contains("\"level\":\"ERROR\"")) {
                        stats.incrementErrors();
                    }
                    return stats;
                },
                Materialized.as("error-stats")
            )
            .toStream()
            .filter((key, stats) -> stats.getErrorRate() > 0.05) // 错误率超过5%
            .to("alerts");
        
        KafkaStreams streams = new KafkaStreams(builder.build(), props);
        streams.start();
    }
}
// 使用 Kafka Streams 进行实时日志分析
public class LogAnalysisStream {
    
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put(StreamsConfig.APPLICATION_ID_CONFIG, "log-analysis");
        props.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG, "kafka:9092");
        
        StreamsBuilder builder = new StreamsBuilder();
        
        // 1. 错误日志统计
        KStream<String, String> logs = builder.stream("app-logs");
        
        logs.filter((key, value) -> value.contains("\"level\":\"ERROR\""))
            .groupBy((key, value) -> extractService(value))
            .count(Materialized.as("error-count-by-service"));
        
        // 2. 慢请求检测
        logs.filter((key, value) -> {
                long duration = extractDuration(value);
                return duration > 1000; // 超过1秒
            })
            .map((key, value) -> new KeyValue<>(extractTraceId(value), value))
            .to("slow-requests");
        
        // 3. 错误率监控
        logs.groupBy((key, value) -> extractService(value))
            .aggregate(
                () -> new ErrorStats(),
                (key, value, stats) -> {
                    stats.incrementTotal();
                    if (value.contains("\"level\":\"ERROR\"")) {
                        stats.incrementErrors();
                    }
                    return stats;
                },
                Materialized.as("error-stats")
            )
            .toStream()
            .filter((key, stats) -> stats.getErrorRate() > 0.05) // 错误率超过5%
            .to("alerts");
        
        KafkaStreams streams = new KafkaStreams(builder.build(), props);
        streams.start();
    }
}

最佳实践总结

Topic 设计规范

┌─────────────────────────────────────────────────────────────────────────┐
│                    Topic 设计最佳实践                                    │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│  命名规范：                                                              │
│  ├── 格式：<领域>.<实体>.<事件类型>                                     │
│  ├── 示例：                                                             │
│  │   ├── order.order.created        # 订单创建事件                     │
│  │   ├── payment.transaction.completed # 支付完成事件                  │
│  │   ├── user.profile.updated       # 用户资料更新                     │
│  │   └── system.metrics.collected   # 系统指标采集                     │
│  └── 避免使用特殊字符和空格                                            │
│                                                                         │
│  分区策略：                                                              │
│  ├── 根据吞吐量估算分区数                                              │
│  ├── 考虑消费者并行度                                                  │
│  ├── 为未来扩展预留空间                                                │
│  └── 建议：生产环境单 Topic 分区数 ≤ Broker数 × 20                     │
│                                                                         │
│  保留策略：                                                              │
│  ├── 业务事件：7-30天                                                  │
│  ├── 日志数据：3-7天                                                   │
│  ├── 审计数据：365天+                                                  │
│  └── 使用日志压缩的场景：用户状态、配置等                              │
│                                                                         │
│  压缩策略：                                                              │
│  ├── 高吞吐场景：lz4                                                   │
│  ├── 存储敏感场景：zstd                                                │
│  └── 平衡场景：snappy                                                  │
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘

生产环境 Checklist

部署前检查：
├── 硬件资源
│   ├── 磁盘空间是否充足（预留30%）
│   ├── 内存是否足够（Heap + Page Cache）
│   └── 网络带宽是否满足峰值需求
│
├── 配置检查
│   ├── 副本数 >= 3
│   ├── min.insync.replicas >= 2
│   ├── unclean.leader.election.enable=false
│   └── 自动创建 Topic 关闭
│
├── 监控告警
│   ├── Broker 状态监控
│   ├── 消费延迟监控
│   ├── 磁盘使用率监控
│   └── 告警规则配置
│
└── 高可用
    ├── 跨机架部署
    ├── 多机房容灾
    └── 备份恢复方案

日常运维：
├── 定期检查消费延迟
├── 定期清理过期数据
├── 定期平衡 Leader 分布
├── 监控集群健康状态
└── 定期演练故障恢复

小结

本章我们学习了：

实时数据处理：用户行为分析、实时推荐系统
事件溯源与 CQRS：订单系统实现、事件存储
日志收集与分析：日志管道架构、实时分析
最佳实践：Topic 设计规范、生产环境 Checklist

参考资料

系列总结

本系列文章系统性地介绍了 Kafka 的核心原理：

概述与架构：核心概念、整体架构、技术选型
消息模型与存储：Topic、Partition、日志段、索引机制
生产者原理：发送机制、分区策略、ACK机制
消费者原理：消费者组、Rebalance、Offset管理
Broker与副本：Broker架构、副本同步、Leader选举
可靠性保证：消息不丢失、Exactly Once、顺序性
高性能设计：顺序写、零拷贝、Page Cache
集群运维：KRaft部署、监控告警、故障排查
企业级实战：实时处理、事件溯源、日志分析

希望通过本系列，你已经全面掌握了 Kafka 的核心原理和最佳实践。

Kafka 核心原理系列完结！感谢阅读！

Kafka核心原理（九）：企业级实战案例

Kafka核心原理（九）：企业级实战案例

前言

实时数据处理平台

架构设计

实时用户行为分析

实时推荐系统

事件溯源与 CQRS

架构设计

订单系统实现

日志收集与分析

架构设计

日志生产者配置

日志分析示例

最佳实践总结

Topic 设计规范

生产环境 Checklist

小结

参考资料

系列总结

相关文章

Kafka核心原理（八）：集群管理与运维

Kafka核心原理（七）：高性能设计原理

Kafka核心原理（六）：消息可靠性保证