自动调优

自动调优功能已在端到端的 Jupyter Notebook 示例中展示

节点分类流水线节点回归流水线以及链路预测流水线均采用监督机器学习方法进行训练,这些方法具有多个可配置参数,会影响训练结果。为了获得高质量的模型,设置合适的超参数值具有重大影响。自动调优通常优于手动搜索,因为后者既耗时又困难。

在向节点分类节点回归链路预测添加模型候选时,可以结合手动和自动调优。对于手动部分,将所有超参数具有固定值的配置添加到流水线中。为了充分利用自动搜索,可以指定超参数处于某个范围之内,而不是使用固定值。对于某些参数,范围按对数刻度进行解析,这适用于通常在对数刻度上进行调优的参数。

如果任何模型候选的超参数被指定为范围,则在训练流水线时将应用自动调优。首先评估仅包含固定值的配置,随后重复选择并评估其余包含范围的配置。对于至少包含一个范围的配置,在评估前会从范围中选择固定值。每一次此类评估称为一次试验(trial)。如果至少存在一个范围,试验次数由 gds.alpha.pipeline.nodeClassification.configureAutoTuninggds.alpha.pipeline.noderegression.configureAutoTuninggds.alpha.pipeline.linkPrediction.configureAutoTuningmaxTrials 配置参数决定。如果任何模型配置中都不存在范围,则无论 maxTrials 的值如何,都会尝试所有配置。所有试验完成后,表现最好的模型候选配置将被选为获胜者。

有关特定超参数的详细信息,请参阅支持的训练方法