亿级数据查询
发布于 6 年前 作者 twss1 2918 次浏览 来自 问答

做亿级节点的关系搜索时,如何提高效率?点索引已建好,做最短路径(shortestPath)的时候没有问题,但是搜索两点间所有关系的时候跑不出来,请问有什么建议吗?

7 回复

搜索所有关系跑不出来,很可能因为中间结果太多,将内存吃满了. 比如所有关系有10000条,1条关系有1MB大小,这个查询就会吃掉10G内存,然后返回结果.

@nonono 同意楼上,试试profile或者explain看看遍历了多少节点

大数据 推荐使用 graphx

@nonono 我用服务器跑的,应该不会吃满

@zhoujieren64 结合spark来跑是不是更好一些?

@pangguoming graphx有个问题,就是里面信息发送是单边的,如何设置参数将发送设置为双边以实现最短路径?

@twss1 neo4j只是一个单纯的图数据库,兼顾一些图分析挖掘的功能,但是如果你是要专门做数据分析挖掘肯定是spark好

回到顶部