Dijkstra 单源最短路径
简介
Dijkstra 最短路径算法用于计算节点之间的最短路径。该算法支持具有正权重的加权图。Dijkstra 单源算法计算源节点与该节点可达的所有其他节点之间的最短路径。如需计算特定源节点与目标节点之间的最短路径,可以使用 Dijkstra 源-目标算法。
适用于 Snowflake 的图分析实现基于原始描述,并使用二叉堆作为优先队列。
语法
本节介绍执行 Dijkstra 算法所使用的语法。
CALL Neo4j_Graph_Analytics.graph.dijkstra_single_source(
'CPU_X64_XS', (1)
{
['defaultTablePrefix': '...',] (2)
'project': {...}, (3)
'compute': {...}, (4)
'write': {...} (5)
}
);
| 1 | 计算池选择器。 |
| 2 | 表引用的可选前缀。 |
| 3 | 项目配置。 |
| 4 | 计算配置。 |
| 5 | 写入配置。 |
| 名称 | 类型 | 默认 | 可选 | 描述 |
|---|---|---|---|---|
computePoolSelector |
字符串 |
|
否 |
用于执行 Dijkstra 单源任务的计算池选择器。 |
配置 |
Map |
|
否 |
用于图项目、算法计算和结果回写的配置。 |
配置映射由以下三个条目组成。
| 有关以下项目配置的更多详细信息,请参阅 项目文档。 |
| 名称 | 类型 |
|---|---|
nodeTables |
节点表列表。 |
relationshipTables |
关系类型到关系表的映射。 |
| 名称 | 类型 | 默认 | 可选 | 描述 |
|---|---|---|---|---|
resultProperty |
字符串 |
|
是 |
将回写到 Snowflake 数据库的关系属性。 |
resultRelationshipType |
字符串 |
|
是 |
用于回写到 Snowflake 数据库的关系类型。 |
sourceNode |
整数或字符串 |
|
否 |
源节点标识符。 |
sourceNodeTable |
字符串 |
|
否 |
用于映射源节点标识符的表。 |
relationshipWeightProperty |
字符串 |
|
是 |
用作权重的关系属性名称。如果未指定,算法将作为无权重运行。 |
| 有关以下写入配置的更多详细信息,请参阅写入文档。 |
| 名称 | 类型 | 默认 | 可选 | 描述 |
|---|---|---|---|---|
sourceLabel |
字符串 |
|
否 |
内存图中待回写关系起始节点的节点标签。 |
outputTable |
字符串 |
|
否 |
关系写入的 Snowflake 数据库表。 |
关系类型 (relationshipType) |
字符串 |
|
是 |
将回写到 Snowflake 数据库的关系类型。 |
relationshipProperty |
字符串 |
|
是 |
将回写到 Snowflake 数据库的关系属性。 |
示例
现在我们将了解如何将 Dijkstra 应用于道路网络。
CREATE OR REPLACE TABLE EXAMPLE_DB.DATA_SCHEMA.locations (NODEID VARCHAR);
INSERT INTO EXAMPLE_DB.DATA_SCHEMA.locations VALUES
('A'),
('B'),
('C'),
('D'),
('E'),
('F');
CREATE OR REPLACE TABLE EXAMPLE_DB.DATA_SCHEMA.roads (SOURCENODEID VARCHAR, TARGETNODEID VARCHAR, COST FLOAT);
INSERT INTO EXAMPLE_DB.DATA_SCHEMA.roads VALUES
('A', 'B', 50),
('A', 'C', 50),
('A', 'D', 100),
('B', 'D', 40),
('C', 'D', 40),
('C', 'E', 80),
('D', 'E', 30),
('D', 'F', 80),
('E', 'F', 40);
此图构建了一个位置之间有道路的交通网络。像现实世界一样,图中的道路具有不同的长度。这些长度由 cost 关系属性表示。
在以下示例中,我们将演示如何使用此图运行 Dijkstra 最短路径算法。
运行任务
运行 Dijkstra 任务涉及三个步骤:投影(Project)、计算(Compute)和写入(Write)。
CALL Neo4j_Graph_Analytics.graph.dijkstra_single_source('CPU_X64_XS', {
'defaultTablePrefix': 'EXAMPLE_DB.DATA_SCHEMA',
'project': {
'nodeTables': [ 'LOCATIONS' ],
'relationshipTables': {
'roads': {
'sourceTable': 'LOCATIONS',
'targetTable': 'LOCATIONS'
}
}
},
'compute': {
'sourceNode': 'A',
'sourceNodeTable': 'LOCATIONS',
'relationshipWeightProperty': 'COST'
},
'write': [{
'sourceLabel': 'LOCATIONS',
'targetLabel': 'LOCATIONS',
'outputTable': 'PATHS'
}]
});
| JOB_ID | JOB_STATUS | JOB_START | JOB_END | JOB_RESULT |
|---|---|---|---|---|
job_82537e4136794bc da31286a0c8807397 |
SUCCESS |
2025-05-06 08:38:55.301000 |
2025-05-06 08:39:01.830000 |
{
"dijkstra_single_source_1": {
"computeMillis": 14,
"configuration": {
"concurrency": 6,
"resultRelationshipType": "PATH",
"nodeLabels": [
"*"
],
"relationshipTypes": [
"*"
],
"relationshipWeightProperty": "COST",
"sourceNode": "A",
"sourceNodeTable": "EXAMPLE_DB.DATA_SCHEMA.LOCATIONS"
}
},
"project_1": {
"graphName": "snowgraph",
"nodeCount": 6,
"nodeLabels": ...,
"nodeMillis": 123,
"relationshipCount": 9,
"relationshipMillis": 325,
"relationshipTypes": ...,
"totalMillis": 448
},
"write_relationship_type_1": {
"outputTable": "EXAMPLE_DB.DATA_SCHEMA.PATHS",
"relationshipProperty": "[SOURCENODEID, TARGETNODEID, NODEIDS, NODELABELS, COSTS, TOTALCOST]",
"relationshipType": "PATH",
"rowsWritten": 0,
"writeMillis": 1619
}
} |
返回的结果包含有关任务执行的信息。此外,最短路径已写回 Snowflake 数据库。我们可以像这样进行查询
SELECT * FROM EXAMPLE_DB.DATA_SCHEMA.PATHS;
这显示了存储在数据库中的计算结果
| SOURCENODEID | TARGETNODEID | NODEIDS | NODELABELS | COSTS | TOTALCOST |
|---|---|---|---|---|---|
A |
A |
["A"] |
["LOCATIONS"] |
[0] |
0 |
A |
B |
["A", "B"] |
["LOCATIONS", "LOCATIONS"] |
[0, 50] |
50 |
A |
C |
["A", "C"] |
["LOCATIONS", "LOCATIONS"] |
[0, 50] |
50 |
A |
D |
["A", "B", "D"] |
["LOCATIONS", "LOCATIONS", "LOCATIONS"] |
[0, 50, 90] |
90 |
A |
E |
["A", "B", "D", "E"] |
["LOCATIONS", "LOCATIONS", "LOCATIONS", "LOCATIONS"] |
[0, 50, 90, 120] |
120 |
A |
F |
["A", "B", "D", "E", "F"] |
["LOCATIONS", "LOCATIONS", "LOCATIONS", "LOCATIONS", "LOCATIONS"] |
[0, 50, 90, 120, 160] |
160 |
结果显示了节点 A 与图中所有其他可达节点之间的最短路径总成本。它还显示了为找到最短路径而遍历的节点 ID(及其标签)的有序列表,以及所访问节点的累积成本。这可以在示例图中进行验证。
|
即使输入图是无向的,所写入的关系也始终是有向的。 |