sklearn.metrics.matthews_corrcoef?

sklearn.metrics.matthews_corrcoef(y_true, y_pred, *, sample_weight=None)

源碼

計算馬修斯相關系數(MCC)

Matthews相關系數在機器學習中用作衡量二進制和多類分類質量的指標。它考慮了真假正例和負例,通常被認為是平衡的度量,即使類別的大小差異很大,也可以使用該度量。MCC本質上是介于-1和+1之間的相關系數值。系數+1代表理想預測,0代表平均隨機預測,-1代表逆預測。該統計也稱為phi系數。[來源:維基百科]

支持二進制和多類標簽。 僅在二進制情況下,才與真假正例和負例有關。 請參閱下面的參考。

用戶指南中閱讀更多內容。

參數 說明
y_true array, shape = [n_samples]
真實目標值。
y_pred array, shape = [n_samples]
分類器返回的估計目標。
sample_weight array-like of shape (n_samples,), default=None
樣本權重。
版本0.18中的新功能。
返回值 說明
mcc float
馬修斯相關系數(+1代表理想預測,0代表平均隨機預測,-1代表反向預測)。

參考

1 Baldi, Brunak, Chauvin, Andersen and Nielsen, (2000). Assessing the accuracy of prediction algorithms for classification: an overview

2 Wikipedia entry for the Matthews Correlation Coefficient

3 Gorodkin, (2004). Comparing two K-category assignments by a K-category correlation coefficient

4 Jurman, Riccadonna, Furlanello, (2012). A Comparison of MCC and CEN Error Measures in MultiClass Prediction

示例

>>> from sklearn.metrics import matthews_corrcoef
>>> y_true = [+1, +1, +1-1]
>>> y_pred = [+1-1, +1, +1]
>>> matthews_corrcoef(y_true, y_pred)
-0.33...