sklearn.utils.Class_weight.compute_class_weight?

sklearn.utils.class_weight.compute_class_weight(class_weight, *, classes, y)

源碼

估計不平衡數據集的類權重。

參數 說明
class_weight dict, ‘balanced’ or None
如果為“平衡”,則類權重將通過n_samples /(n_classes * np.bincount(y))給出權重。 如果傳入字典,則鍵為類,值為相應的類權重。 如果未指定,則類權重將是一致的。
classes ndarray
數據中出現的類的數組,由np.unique(y_org)和y_org的原始類標簽給出。
y array-like, shape (n_samples,)
每個樣本的原始類標簽數組。
返回值 說明
class_weight_vect ndarray, shape (n_classes,)
第i個類的權重

參考資料

“平衡的”啟發式方法是根據《稀有事件數據》中的邏輯回歸得出的,King,Zen,2001。