操作
从 AuraDB/Neo4j 读取(导出)
导出的源是安装步骤中创建的连接,例如 aws-glue-connection-to-neo4j-auradb。
导出数据的目标可以是 AWS Glue 支持的任何数据源,例如位于 S3 上的 CSV 或 Parquet 文件,或通过适当转换步骤的关系型数据库(RDBMS)。
写入 AuraDB/Neo4j(导入)
源数据可以是 AWS Glue 支持的任何数据源,例如位于 S3 上的 CSV 或 Parquet 文件,或通过适当转换步骤的关系型数据库(RDBMS)。
导入的目标将是安装步骤中创建的连接,例如 aws-glue-connection-to-neo4j-auradb。
在将数据导入空数据库之前,需要在 AuraDB/Neo4j 中定义一个蓝图,描述将要导入的数据的模式。此蓝图必须描述数据集中所有的节点标签、关系类型和属性。这是因为 Neo4j 数据库是模式可选的,而 AWS Glue 在写入时要求模式,这是关系型数据库的常规做法。
如果在未创建此蓝图模式的情况下尝试导入数据,将会出现以下错误
Glue ETL Marketplace: table does not exist.
如果目标节点标签、属性或关系类型不存在,此信息同样适用,错误信息在所有情况下都是相同的。
关系
关系必须在导入作业中的节点之后创建,或在节点导入作业完成后由另一个导入作业创建。在 Visual ETL 工具中,你只能使用诸如 SQL Query 之类的转换来创建关系,并提供所需的参数。有关更多信息,请参阅 [Neo4j JDBC 文档](/docs/jdbc-manual/current/sql2cypher/#s2c_manipulating_relationships)。