数据导入节点和关系分开导入,如何快速导入
发布于 9 天前 作者 fab123 43 次浏览 来自 问答

原始数据节点和关系分别两张表,节点表是手机信息,关系表是通话记录,通话记录起点和终点用手机号标识;因为有可能关系导入的时候相关起点终点还未导入neo4j,所以用原生api的findnode和createnode配合结合事务,导入前检测节点不存在则创建(以手机号字段建索引),比较慢,11个小时导入了1亿1千万左右关系及相关节点;neo4j的batchinsert比原生createnode速度快很多,但是感觉这种方法强调导入的数据跟已有数据没有什么关联性的检测(比如是否存在),不知道怎么设计导入策略比较好,我想实现数据增量导入,尽量速度快。

回到顶部