sklearn.utils.Class_weight.compute_class_weight?
sklearn.utils.class_weight.compute_class_weight(class_weight, *, classes, y)
估計不平衡數據集的類權重。
參數 | 說明 |
---|---|
class_weight | dict, ‘balanced’ or None 如果為“平衡”,則類權重將通過n_samples /(n_classes * np.bincount(y))給出權重。 如果傳入字典,則鍵為類,值為相應的類權重。 如果未指定,則類權重將是一致的。 |
classes | ndarray 數據中出現的類的數組,由np.unique(y_org)和y_org的原始類標簽給出。 |
y | array-like, shape (n_samples,) 每個樣本的原始類標簽數組。 |
返回值 | 說明 |
---|---|
class_weight_vect | ndarray, shape (n_classes,) 第i個類的權重 |
參考資料
“平衡的”啟發式方法是根據《稀有事件數據》中的邏輯回歸得出的,King,Zen,2001。