自然语言处理 (NLP)

本章中描述的过程是基于云的自然语言 API 的封装。这些过程可以从存储为节点属性的文本中提取实体、关键短语、类别和情感。

本节内容包括

Neo4j 为结构化数据提供了强大的查询能力,但世界上许多数据都存在于文本文档中。NLP 技术有助于提取这些文档中的潜在结构。这种结构可以简单到表示句子中词元的节点,也可以复杂到表示使用命名实体识别算法提取的实体的节点。

为什么要使用 NLP?

从文本文档中提取结构并将其存储在图中可以实现多种不同的用例,包括:

  • 基于内容的推荐

  • 自然语言搜索

  • 文档相似度

apoc.nlp.* 过程

它包含调用 Amazon Web Services (AWS)、Google Cloud Platform (GCP) 和 Microsoft Azure 自然语言 API 的过程,并根据返回的结果创建图。

这些过程支持实体提取、关键短语提取、情感分析和文档分类。

开发人员指南

以下指南展示了如何解决各种与 NLP 相关的问题

其他方法

为了完整起见,我们列举了其他可能的 NLP 方法。

Hume 是由 Neo4j 合作伙伴 GraphAware 开发的图驱动洞察引擎。它可用于构建知识图谱,帮助发掘组织中先前被掩盖和未被发现的相关性。

以下文章描述了使用 Python 库和 Cypher 进行 NLP 分析的其他方法

© . This site is unofficial and not affiliated with Neo4j, Inc.