Kafka

APOC Kafka 过程

要启用 Kafka 依赖，我们需要设置 APOC 配置 apoc.kafka.enabled=true

任何以 apoc.kafka. 开头的配置选项都用于控制过程本身的运行行为。

Kafka 依赖包含在 apoc-kafka-dependencies-2025.10.0-all.jar 中，可从发布页面下载。下载该文件后，应将其放入 plugins 目录并重启 Neo4j 服务器。

任何以 apoc.kafka. 开头的配置选项都将传递给底层的 Kafka 驱动程序。Neo4j Kafka 过程使用官方的 Confluent Kafka 生产者和消费者 Java 客户端。对这些连接器有效的配置设置同样适用于 APOC Kafka。

例如，在下方链接的 Kafka 文档中，名为 batch.size 的配置设置在 APOC Kafka 中应写为 apoc.kafka.batch.size。

以下是您可能希望使用的常见配置设置。.最常用的配置设置

设置名称	描述	默认值
apoc.kafka.max.poll.records	每批次从 Kafka 拉取的最大记录数。增加此数字意味着 Neo4j 内存中的事务量会变大，并可能提高吞吐量。	500
apoc.kafka.buffer.memory	生产者可用于缓冲等待记录的总字节内存。使用此项可调整过程在保存尚未传递到 Neo4j 的消息时可能需要的内存量。	33554432
apoc.kafka.batch.size	（仅限生产者）当多条记录被发送到同一分区时，生产者将尝试将记录分批处理为较少的请求。这有助于提高客户端和服务器的性能。此配置控制以字节为单位的默认批处理大小。	16384
apoc.kafka.max.partition.fetch.bytes	（仅限消费者）服务器每分区返回的最大数据量。记录由消费者分批获取。如果获取的第一个非空分区中的第一个记录批次大于此限制，该批次仍将返回，以确保消费者能够继续进行。	1048576
apoc.kafka.group.id	标识此消费者所属消费者组的唯一字符串。	不适用

设置名称

描述

默认值

apoc.kafka.max.poll.records

每批次从 Kafka 拉取的最大记录数。增加此数字意味着 Neo4j 内存中的事务量会变大，并可能提高吞吐量。

500

apoc.kafka.buffer.memory

生产者可用于缓冲等待记录的总字节内存。使用此项可调整过程在保存尚未传递到 Neo4j 的消息时可能需要的内存量。

33554432

apoc.kafka.batch.size

（仅限生产者）当多条记录被发送到同一分区时，生产者将尝试将记录分批处理为较少的请求。这有助于提高客户端和服务器的性能。此配置控制以字节为单位的默认批处理大小。

16384

apoc.kafka.max.partition.fetch.bytes

（仅限消费者）服务器每分区返回的最大数据量。记录由消费者分批获取。如果获取的第一个非空分区中的第一个记录批次大于此限制，该批次仍将返回，以确保消费者能够继续进行。

1048576

apoc.kafka.group.id

标识此消费者所属消费者组的唯一字符串。

不适用

如果您在本地或针对独立机器运行，请配置 apoc.conf 以指向该服务器

neo4j.conf

apoc.kafka.bootstrap.servers=localhost:9092

如果您正在使用 Confluent Cloud（托管 Kafka），您可以按照 Confluent Cloud 部分中的说明连接到 Kafka

插件安装并配置完成后，重启数据库即可使其生效。如果您已配置 Neo4j 从 Kafka 消费数据，它将立即开始处理消息。