知识库

图分析通俗解释

图一般在提供关系非常重要的答案时非常强大。在这种情况下,使用图查询(Cypher)可以在我们知道要寻找什么时回答具体问题,例如

  • 通过使用交易数据来发现欺诈者及受害者,

  • 然后进一步将这种关系扩展到相关的产品目录,以生成推荐,

  • 随后将其与流程集成,以构建数字孪生以及供应链信息。

因此,通过定义上述领域之间的关系,我们可以为客户360、欺诈检测、产品推荐、数字孪生、供应链等用例带来巨大的价值。

话虽如此,除了具体的点查询外,如果我们想深入洞察这些数据,以回答诸如发现社区或一般重要性的问题,该怎么办?

对于这些用例,图数据科学库(GDS)就派上用场了,因为它提供了许多实用算法,使我们能够及时完成各种高级操作。

无监督算法

例如,如果您想了解什么是重要的,该怎么办?实际上,GDS拥有超过50个(无监督学习)算法,能够为下面列出的各种示例查询提供答案。

  • 哪些节点最重要?

  • 哪些节点聚类在一起?

  • 哪些节点最相似?

  • 哪些节点最异常?

或 (OR)

  • 聚类位于何处?

  • 我的图的哪些部分相互连接更密集?

  • 哪些部分可能会相连?

  • 哪些模式是常见的?

  • 通过嵌入查找关联和低维表示。

一般来说,无监督的GDS算法让我们能够发现以下模式:

  • 中心性计算 — 找出网络中关键且居于中心的对象,

  • 相似性算法 — 对象之间的相似度(基于属性和连接)

  • 路径查找算法 — 到某个目标的最短路径

  • 社区检测算法 — 存在的社区有哪些

  • 启发式链接预测 — 基于一套规则预测关系

监督算法与机器学习

通常情况下,您希望利用图数据根据过去的数据对未来进行预测,例如标记(即潜在欺诈者)或推荐(即流失)。

在这种情况下,您可以使用图嵌入来创建图的数值/表格表示,以供机器学习模型使用,从而简化这些任务;更重要的是,我们还能进一步利用特征提取算法来丰富训练数据(从而提升模型),实现对预测的持续精度提升。

归根结底,来自数据库内图数据的嵌入训练数据的优势在于无需将数据从外部迁移,相关任务可以更快速、更便捷地完成。

© . This site is unofficial and not affiliated with Neo4j, Inc.