其他查询机制
隐式(或自动提交)事务
隐式事务是唯一可用于 CALL { … } IN TRANSACTIONS 查询的事务类型。 |
隐式事务是事务最基础、最受限的形式。驱动程序不会自动重试隐式事务,这与使用 .executableQuery() 和 托管事务 运行的查询不同。只有当其他查询接口不适用或仅用于快速原型设计时,才应使用隐式事务。
// import java.util.Map
// import org.neo4j.driver.SessionConfig
try (var session = driver.session(SessionConfig.builder().withDatabase("<database-name>").build())) {
session.run("CREATE (a:Person {name: $name})", Map.of("name", "Licia"));
}
为确保隐式事务被提交,请处理所有记录(通过对结果调用 .consume() 或迭代所有记录)。如果不处理所有记录,可能会产生意想不到的行为:无法保证隐式事务在会话生命周期内的具体提交时间。
由于驱动程序无法判断 Session.run() 调用中的查询是需要读会话还是写会话,因此它默认为写入模式。如果您的隐式事务仅包含读取查询,通过在创建会话时使用配置方法 .withRouting(RoutingControl.READ) 告知驱动程序,可以提升性能。
导入 CSV 文件
使用 Session.run() 最常见的用例是结合 Cypher 的 LOAD CSV 子句将大型 CSV 文件导入数据库,并防止因事务过大而导致的超时错误。
// import java.util.Map
// import org.neo4j.driver.SessionConfig
try (var session = driver.session(SessionConfig.builder().withDatabase("<database-name>").build())) {
var result = session.run("""
LOAD CSV FROM 'https://data.neo4j.com/bands/artists.csv' AS line
CALL {
WITH line
MERGE (:Artist {name: line[1], age: toInteger(line[2])})
} IN TRANSACTIONS OF 2 ROWS
""");
var summary = result.consume();
System.out.println(summary.counters());
}
虽然 LOAD CSV 很方便,但将 CSV 文件的解析工作推迟到 Java 应用程序中处理并没有什么不好,反而可以避免使用 LOAD CSV。事实上,将解析逻辑移至应用程序可以为您提供对导入过程更强的控制力。有关高效批量数据插入的信息,请参阅 性能 → 批量数据创建。 |
更多信息,请参阅 Cypher → 子句 → LOAD CSV。
事务配置
您可以通过提供 TransactionConfig 对象作为 Session.run() 调用的可选最后一个参数,来对隐式事务进行进一步控制。配置回调允许指定查询超时时间并为事务附加元数据。更多信息,请参阅 事务 → 事务配置。
// import java.util.Map
// import java.time.Duration
// import org.neo4j.driver.SessionConfig
// import org.neo4j.driver.TransactionConfig
try (var session = driver.session(SessionConfig.builder().withDatabase("<database-name>").build())) {
var result = session.run("CREATE (a:Person {name: $name})", Map.of("name", "John"),
TransactionConfig.builder()
.withTimeout(Duration.ofSeconds(5))
.withMetadata(Map.of("appName", "peopleTracker"))
.build()
);
}
属性键、关系类型和标签中的动态值
通常,你不应该直接将参数拼接到查询字符串中,而应该使用 查询参数。然而,在某些情况下,查询结构可能导致无法在所有地方使用参数。实际上,尽管参数适用于字面量、表达式以及 节点标签和关系类型,但它们不能用于属性键,因此 MATCH (n) WHERE n.$param = 'something' 是无效的。
使用字符串拼接时,请将动态值用反引号括起来,并自行进行转义以防止 Cypher 注入。请注意,Cypher 处理 Unicode,因此也要留意 Unicode 字面量 \u0060。
// import org.neo4j.driver.QueryConfig;
var dangerousKey = "name\\u0060n";
// convert \u0060 to literal backtick and then escape backticks
var escapedKey = dangerousKey.replace("\\u0060", "`").replace("`", "``");
var result = driver.executableQuery("MATCH (p:Person {`' + escapedKey + '`: $name}) RETURN p.name")
.withParameters(Map.of("name", "Alice"))
.withConfig(QueryConfig.builder().withDatabase("<database-name>").build())
.execute();
// rewritten to
// MATCH (p:Person {`name```: $name}) RETURN p.name
避免字符串拼接的另一种变通方法是使用 APOC 过程,例如 apoc.merge.node,它支持动态标签和属性键。
apoc.merge.node 创建带有动态标签/属性键的节点。// import org.neo4j.driver.QueryConfig;
String propertyKey = "name";
String label = "Person";
var result = driver.executableQuery("CALL apoc.merge.node($labels, $properties)")
.withParameters(Map.of("labels", List.of(label), "properties", Map.of(propertyKey, "Alice")))
.withConfig(QueryConfig.builder().withDatabase("<database-name>").build())
.execute();
| 如果你在 Docker 中运行 Neo4j,则在启动容器时需要启用 APOC。请参阅 APOC → 安装 → Docker。 |
术语表
- LTS (长期支持版)
-
长期支持 (Long Term Support) 版本是保证在若干年内得到支持的版本。Neo4j 4.4 和 5.26 是 LTS 版本。
- Aura
-
Aura 是 Neo4j 的全托管云服务。它提供免费和付费计划。
- Cypher
-
Cypher 是 Neo4j 的图查询语言,允许您从数据库中检索数据。它就像 SQL,但专用于图数据库。
- APOC
-
Awesome Procedures On Cypher (APOC) 是一个包含(许多)函数的库,这些函数在 Cypher 本身中难以轻松实现。
- Bolt
-
Bolt 是用于 Neo4j 实例和驱动程序之间交互的协议。默认监听 7687 端口。
- ACID
-
原子性 (Atomicity)、一致性 (Consistency)、隔离性 (Isolation)、持久性 (Durability) (ACID) 是保证数据库事务可靠处理的属性。符合 ACID 的 DBMS 确保即使发生故障,数据库中的数据也能保持准确和一致。
- 最终一致性
-
如果一个数据库能保证所有集群成员在某个时间点都存储了数据的最新版本,则该数据库具有最终一致性。
- 因果一致性
-
如果读写查询被集群中的每个成员以相同的顺序看到,则数据库具有因果一致性。这比最终一致性更强。
- NULL
-
空标记不是一种类型,而是缺失值的占位符。更多信息,请参阅 Cypher → 使用
null。 - 事务
-
事务是一个工作单元,要么被提交,要么在失败时被回滚。例如银行转账:它涉及多个步骤,但它们必须全部成功或全部撤销,以避免钱从一个账户扣除却未存入另一个账户的情况。
- 背压
-
背压是对数据流的抵抗力。它确保客户端不会被过快发送的数据压垮,从而超出其处理能力。
- 书签
-
书签是代表数据库某种状态的标记。通过将一个或多个书签与查询一起传递,服务器将确保在所表示的状态建立之前,该查询不会被执行。
- 事务函数
-
事务函数是由
executeRead或executeWrite调用执行的回调。如果发生服务器故障,驱动程序会自动重新执行该回调。 - 驱动程序 (Driver)
-
Driver对象保存了与 Neo4j 数据库建立连接所需的详细信息。