运行导入作业

您可以通过 本地 Dataflow Runner 在本地验证您的规范文件。该工具能够在本地验证您的作业文件是否符合模板规范,并在临时 Neo4j 容器中执行它(它依赖于 Apache Beam 的 Direct Runner;在 Dataflow 中仍可能出现运行时错误)。这种验证方式比提交 Dataflow 作业要快得多。

当作业规范准备好后,将其 JSON 文件上传到您的 Cloud Storage 桶,然后转到 Dataflow → 从模板创建作业

创建作业时,请指定以下字段

  • 作业名称 — 作业的易读名称。

  • 区域端点 — 必须与包含配置和源文件的 Google Cloud Storage 桶所在的区域匹配。如果运行 文档中提供的完整示例,请将区域设置为 us 系列之一。

  • Dataflow 模板 — 选择 Google Cloud to Neo4j

  • 作业配置文件路径 — JSON 作业规范文件(来自 Google Cloud Storage 桶)。

  • 可选参数 > Options JSON — 作业规范文件中使用的 变量 的取值。

连接元数据可以作为 secret 或明文 JSON 资源进行指定。必须仅指定其中一种!

  • 可选参数 > Neo4j 连接元数据路径 — JSON 连接信息文件(来自 Google Cloud Storage 桶)。

  • 可选参数 > Neo4j 连接元数据的 Secret ID — 包含 JSON 连接信息的 secret ID(来自 Google Secret Manager)。

image$dataflow job example