昇腾社区首页
中文
注册

总体说明

本章节提供的精度计算方式仅供参考,代码仅为辅助算法上的理解。

对于一个聚类模型(聚类算法)而言,很难评估其在未知数据集上的精度和性能,常用方式是选择特定任务上数据集的一个子集,人工执行标记,从而根据此子集进行评估,并扩展到特定算法在特定任务上的全局精度,本章节提供了几项指标可供用户在实际使用中进行参考。

假设我们已经有如下的信息:

  • GroundTruthDic:dictionary类型,key为特征原始id,value为特征向量对应类label。
  • GroundTruthCluster:list of list,list中的每一个list表示一个聚类。
  • PredictedCluster:list of list,list中的每一个list表示一个聚类。