sklearn.dummy.DummyClassifier?
class sklearn.dummy.DummyClassifier(*, strategy='warn', random_state=None, constant=None)
DummyClassifier是一種使用簡單規則進行預測的分類器。
這個分類器作為與其他(真實的)分類器進行比較的簡單基線非常有用。不要用它來解決真正的問題。
在用戶指南中閱讀更多內容。
新版本0.13。
參數 | 說明 |
---|---|
strategy | str, default=”stratified” 用來產生預測的策略。 “分層的”:通過尊重訓練集的類分布來生成預測。 “most_frequency”:總是預測訓練集中出現頻率最高的標簽。 “prior”:總是預測最大化類prior的類(比如“most_frequency”),而predict_proba返回類prior。 “均勻”:均勻地隨機生成預測。 “常量”:總是預測用戶提供的常量標簽。這對于評估非大多數類的度量是有用的 在0.22版本中更改:策略的默認值在0.24版本中將更改為“prior”。從版本0.22開始,如果沒有顯式地設置策略,就會發出警告。 新版本0.17:虛擬分類器現在支持使用參數先驗的先驗擬合策略。 |
random_state | int, RandomState instance or None, optional, default=None 當策略='分層'或策略='統一'時,控制產生預測的隨機性。在多個函數調用之間傳遞可重復輸出的int。看到術語表。 |
constant | int or str or array-like of shape (n_outputs,) 由“常數”策略預測的顯式常數。這個參數只對“常量”策略有用。 |
屬性 | 說明 |
---|---|
classes_ | array or list of array of shape (n_classes,) 每個輸出的類標簽。 |
n_classes_ | array or list of array of shape (n_classes,) 每個輸出的標簽數。 |
class_prior_ | array or list of array of shape (n_classes,) 每個類對每個輸出的概率。 |
n_outputs_ | int, 數量的輸出。 |
sparse_output_ | bool, 如果從predict返回的數組是稀疏CSC格式,則為True。如果輸入y以稀疏格式傳遞,則自動設置為真。 |
示例
>>> import numpy as np
>>> from sklearn.dummy import DummyClassifier
>>> X = np.array([-1, 1, 1, 1])
>>> y = np.array([0, 1, 1, 1])
>>> dummy_clf = DummyClassifier(strategy="most_frequent")
>>> dummy_clf.fit(X, y)
DummyClassifier(strategy='most_frequent')
>>> dummy_clf.predict(X)
array([1, 1, 1, 1])
>>> dummy_clf.score(X, y)
0.75
方法
方法 | 說明 |
---|---|
fit (self, X, y[, sample_weight]) |
F適合隨機分類器。 |
get_params (self[, deep]) |
獲取這個估計器的參數。 |
predict (self, X) |
對測試向量X進行分類。 |
predict_log_proba (self, X) |
測試向量X的返回對數概率估計。 |
predict_proba (self, X) |
測試向量X的返回概率估計。 |
score (self, X, y[, sample_weight]) |
返回給定測試數據和標簽的平均精度。 |
set_params (self, **params) |
設置這個估計器的參數。 |
__init__(self, *, strategy='warn', random_state=None, constant=None)
初始化self. See 請參閱help(type(self))以獲得準確的說明 。
fit(self, X, y, sample_weight=None)
參數 | 說明 |
---|---|
X | {array-like, object with finite length or shape} 訓練數據,要求length = n_samples |
y | array-like of shape (n_samples,) or (n_samples, n_outputs) 目標的價值。 |
sample_weight | array-like of shape (n_samples,), default=None 樣本權重。 |
get_params(self, deep=True)
獲取這個估計器的參數。
參數 | 說明 |
---|---|
deep | bool, default=True 如果為真,將返回此估計器的參數以及包含的作為估計器的子對象。 |
返回值 | 說明 |
---|---|
params | mapping of string to any 參數名稱映射到它們的值。 |
predict(self, X)
對測試向量X進行分類。
參數 | 說明 |
---|---|
X | {array-like, object with finite length or shape} 訓練數據,要求length = n_samples |
返回值 | 說明 |
---|---|
y | array-like of shape (n_samples,) or (n_samples, n_outputs) X的預測目標值。 |
predict_log_proba(self, X)
測試向量X的返回對數概率估計。
參數 | 說明 |
---|---|
X | {array-like, object with finite length or shape} 訓練數據,要求length = n_samples |
返回值 | 說明 |
---|---|
P | array-like or list of array-like of shape (n_samples, n_classes) 返回模型中每個類的樣本的日志概率,其中類對每個輸出進行算術排序。 |
predict_proba(self, X)
測試向量X的返回概率估計。
參數 | 說明 |
---|---|
X | {array-like, object with finite length or shape} 訓練數據,要求length = n_samples |
返回值 | 說明 |
---|---|
P | array-like or list of array-like of shape (n_samples, n_classes) 返回模型中每個類的抽樣概率,其中類對每個輸出進行算術排序。 |
score(self, X, y, sample_weight=None)
返回給定測試數據和標簽的平均精度。
在多標簽分類中,這是子集精度,這是一個苛刻的指標,因為你需要對每個樣本正確預測每個標簽集。
參數 | 說明 |
---|---|
X | {array-like, None} 使用shape = (n_samples, n_features)或None測試樣本。通過None作為測試樣本與通過真實測試樣本得到的結果相同,因為DummyClassifier的操作獨立于采樣的觀察值。 |
y | array-like of shape (n_samples,) or (n_samples, n_outputs) X的真實標簽。 |
sample_weight | array-like of shape (n_samples,), default=None 樣本權重。 |
返回值 | 說明 |
---|---|
score | float self.predict(X) 與y的平均準確度。 |
set_params(self, **params)
設置這個估計器的參數。
該方法適用于簡單估計量和嵌套對象。后者具有形式為<component>_<parameter>
的參數,這樣就讓更新嵌套對象的每個組件成為了可能。
參數 | 說明 |
---|---|
**params | dict 估計器參數。 |
返回值 | 說明 |
---|---|
self | object 估計器實例。 |