Kafka
APOC Kafka 过程
要启用 Kafka 依赖,我们需要设置 APOC 配置 apoc.kafka.enabled=true |
任何以 apoc.kafka. 开头的配置选项都用于控制过程本身的运行行为。
安装依赖项
Kafka 依赖包含在 apoc-kafka-dependencies-2025.10.0-all.jar 中,可从 发布页面 下载。下载该文件后,应将其放入 plugins 目录并重启 Neo4j 服务器。
Kafka 设置
任何以 apoc.kafka. 开头的配置选项都将传递给底层的 Kafka 驱动程序。Neo4j Kafka 过程使用官方的 Confluent Kafka 生产者和消费者 Java 客户端。对这些连接器有效的配置设置同样适用于 APOC Kafka。
例如,在下方链接的 Kafka 文档中,名为 batch.size 的配置设置在 APOC Kafka 中应写为 apoc.kafka.batch.size。
以下是您可能希望使用的常见配置设置。.最常用的配置设置
| 设置名称 | 描述 | 默认值 |
|---|---|---|
apoc.kafka.max.poll.records |
每批次从 Kafka 拉取的最大记录数。增加此数字意味着 Neo4j 内存中的事务量会变大,并可能提高吞吐量。 |
500 |
apoc.kafka.buffer.memory |
生产者可用于缓冲等待记录的总字节内存。使用此项可调整过程在保存尚未传递到 Neo4j 的消息时可能需要的内存量。 |
33554432 |
apoc.kafka.batch.size |
(仅限生产者)当多条记录被发送到同一分区时,生产者将尝试将记录分批处理为较少的请求。这有助于提高客户端和服务器的性能。此配置控制以字节为单位的默认批处理大小。 |
16384 |
apoc.kafka.max.partition.fetch.bytes |
(仅限消费者)服务器每分区返回的最大数据量。记录由消费者分批获取。如果获取的第一个非空分区中的第一个记录批次大于此限制,该批次仍将返回,以确保消费者能够继续进行。 |
1048576 |
apoc.kafka.group.id |
标识此消费者所属消费者组的唯一字符串。 |
不适用 |
配置 Kafka 连接
如果您在本地或针对独立机器运行,请配置 apoc.conf 以指向该服务器
apoc.kafka.bootstrap.servers=localhost:9092
如果您正在使用 Confluent Cloud(托管 Kafka),您可以按照 Confluent Cloud 部分中的说明连接到 Kafka