sklearn.metrics.completeness_score?

sklearn.metrics.completeness_score(labels_true, labels_pred)

源碼

給定真實值的聚類標簽的完整性度量。

如果屬于給定類的所有數據點都是同一群集的元素,則群集結果將滿足完整性要求。

此指標獨立于標簽的絕對值:類別或簇標簽值的排列不會以任何方式改變得分值。

此度量標準不是對稱的:將label_true與label_pred切換將返回homogeneity_score,該分數通常會有所不同。

用戶指南中閱讀更多內容。

參數 說明
labels_true int array, shape = [n_samples]
真實類標簽用作參考。
labels_pred array-like of shape (n_samples,)
聚類標簽以進行評估。
返回值 說明
completeness float
分數介于0.0和1.0之間。 1.0代表完全標簽

另見:

homogeneity_score

v_measure_score

參考

1 Andrew Rosenberg and Julia Hirschberg, 2007. V-Measure: A conditional entropy-based external cluster evaluation measure

示例

完全標簽是完整的:

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0011], [1100])
1.0

將所有類成員分配到同一集群的非完全標簽仍然是完整的:

>>> print(completeness_score([0011], [0000]))
1.0
>>> print(completeness_score([0123], [0011]))
0.999...

如果類成員分散在不同的群集中,則分配無法完成:

>>> print(completeness_score([0011], [0101]))
0.0
>>> print(completeness_score([0000], [0123]))
0.0