sklearn.metrics.completeness_score?
sklearn.metrics.completeness_score(labels_true, labels_pred)
給定真實值的聚類標簽的完整性度量。
如果屬于給定類的所有數據點都是同一群集的元素,則群集結果將滿足完整性要求。
此指標獨立于標簽的絕對值:類別或簇標簽值的排列不會以任何方式改變得分值。
此度量標準不是對稱的:將label_true與label_pred切換將返回homogeneity_score
,該分數通常會有所不同。
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
labels_true | int array, shape = [n_samples] 真實類標簽用作參考。 |
labels_pred | array-like of shape (n_samples,) 聚類標簽以進行評估。 |
返回值 | 說明 |
---|---|
completeness | float 分數介于0.0和1.0之間。 1.0代表完全標簽 |
另見:
參考
示例
完全標簽是完整的:
>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0
將所有類成員分配到同一集群的非完全標簽仍然是完整的:
>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...
如果類成員分散在不同的群集中,則分配無法完成:
>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0