对于上亿的数据,大家有什么好的方法进行导入吗?
发布于 19 天前 作者 aqzwy 120 次浏览 来自 问答

1.直接CSV文件一次性导入 2.导入部分,load CSV进行其余数据的更新录入 大家做过类似的给点指导性建议

6 回复

如果是第一次导入,建议使用neo4j-admin.bat import命令行。import是离线的数据导入工具,直接写入数据库存储文件,性能比LoadCSV要快很多。具体命令行的使用说明参见: https://neo4j.com/docs/operations-manual/current/tools/import/ 因为是离线导入,数据库服务是不运行的。导入数据保存在CSV文件里面,要注意的是数据质量,尽量去除重复数据,因为比较和过滤会消耗很多时间和资源。

@graphway 我目前用的是import 导入csv ,虽然数据导入了,但后期的数据更新不能一遍遍的通过import来进行,有没有3.1.0以上版本能够停机或者不停机就能进行数据批量更新的好方法

我也想知道官方有没有这样的工具,neo4j-admin import一次建库是没问题,但是后面想增加节点好像不行

@mumum 同样的想法

@graphway 这两个哪个比较好 我总觉得LOAD CSV 还是慢

回到顶部