sklearn.metrics.homogeneity_completeness_v_measure?

sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)

源碼

一次計算同質性和完整性以及V-Measure分數。

這些度量基于聚類標簽的歸一化條件熵度量,在考慮同一樣本的真實標簽的情況下進行評估。

如果所有聚類僅包含屬于單個類的成員的數據點,則聚類結果滿足同質性。

如果屬于給定類的所有數據點都是同一群集的元素,則群集結果將滿足完整性要求。

兩個分數的正值在0.0到1.0之間,較大的值是可取的。

這3個指標與標簽的絕對值無關:類別或簇標簽值的排列不會以任何方式改變得分值。

V-Measure也是對稱的:交換labels_true和label_pred將得到相同的分數。這不適用于同質性和完整性。使用算術平均方法,V度量與normalized_mutual_info_score 相同。

用戶指南中閱讀更多內容。

參數 說明
labels_true int array, shape = [n_samples]
真實類標簽用作參考
labels_pred array-like of shape (n_samples,)
聚類標簽以進行評估
beta float
歸因于均質性(homogeneity)與完整性(completeness)的比重比。如果beta大于1,則在計算中對完整性的加權更大。如果beta小于1,則同質性的權重會更大。
返回值 說明
homogeneity float
分數介于0.0和1.0之間。1.0代表完全的均質標簽
completeness float
分數介于0.0和1.0之間。 1.0代表完全標簽
v_measure float
前兩個的調和平均數

另見:

homogeneity_score

completeness_score

v_measure_score