节点分类管道

此功能处于 Beta 测试阶段。有关功能分级的更多信息,请参阅 API 分级

节点分类流水线在端到端的 Jupyter Notebook 示例中有所介绍

节点分类是应用于图的一种常见机器学习任务:训练模型对节点进行分类。具体而言,节点分类模型用于根据其他节点属性来预测未标记节点的类别(作为节点属性)。在训练过程中,表示节点类别的属性被称为目标属性。GDS 支持二分类和多分类节点分类。

在 GDS 中,我们拥有节点分类流水线,它提供了从特征提取到节点分类的端到端工作流。训练流水线位于 流水线目录 中。当训练流水线被 执行 时,会创建一个分类模型并将其存储在 模型目录 中。

训练流水线包含两个阶段的序列

  1. 图通过一系列步骤增加新的节点属性。

  2. 增强后的图用于训练节点分类模型。

用户可以 配置 上述包含哪些步骤。这些步骤执行 GDS 算法,从而创建新的节点属性。在配置完节点属性步骤后,用户可以 选择 节点属性的子集作为特征。训练阶段 (II) 通过交叉验证训练多个模型候选者,选择最优模型,并报告相关的性能指标。

训练流水线 之后,会创建一个分类模型。该模型包含训练流水线中的节点属性步骤和特征配置,并使用它们为分类未标记节点生成相关特征。分类模型可以应用于预测以前未见过的节点的类别。除了每个节点的预测类别外,每个类别的预测概率也可以保留在节点上。概率的顺序与模型中注册的类别顺序相匹配。

分类 只能使用分类模型完成(不能使用训练流水线)。

本节分为以下页面