sklearn.metrics.homogeneity_completeness_v_measure?
sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)
一次計算同質性和完整性以及V-Measure分數。
這些度量基于聚類標簽的歸一化條件熵度量,在考慮同一樣本的真實標簽的情況下進行評估。
如果所有聚類僅包含屬于單個類的成員的數據點,則聚類結果滿足同質性。
如果屬于給定類的所有數據點都是同一群集的元素,則群集結果將滿足完整性要求。
兩個分數的正值在0.0到1.0之間,較大的值是可取的。
這3個指標與標簽的絕對值無關:類別或簇標簽值的排列不會以任何方式改變得分值。
V-Measure也是對稱的:交換labels_true和label_pred將得到相同的分數。這不適用于同質性和完整性。使用算術平均方法,V度量與normalized_mutual_info_score
相同。
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
labels_true | int array, shape = [n_samples] 真實類標簽用作參考 |
labels_pred | array-like of shape (n_samples,) 聚類標簽以進行評估 |
beta | float 歸因于均質性(homogeneity)與完整性(completeness)的比重比。如果beta大于1,則在計算中對完整性的加權更大。如果beta小于1,則同質性的權重會更大。 |
返回值 | 說明 |
---|---|
homogeneity | float 分數介于0.0和1.0之間。1.0代表完全的均質標簽 |
completeness | float 分數介于0.0和1.0之間。 1.0代表完全標簽 |
v_measure | float 前兩個的調和平均數 |
另見: