sklearn.feature_selection.SelectFdr?
class sklearn.feature_selection.SelectFdr(score_func=<function f_classif>, *, alpha=0.05)
過濾器:為估計的錯誤發現率選擇p值
這使用了Benjamini-Hochberg過程。alpha
是預期的錯誤發現率的上限。
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
score_func | callable 函數接受兩個數組X和y,并返回一對數組(分數,p值)或帶分數的單個數組。默認值為f_classif(請參見下文“另見”)。默認函數僅適用于分類任務。 |
alpha | float, optional 要保留特征的最高未校正p值。 |
屬性 | 說明 |
---|---|
scores_ | array-like of shape (n_features,) 特征分數。 |
pvalues_ | array-like of shape (n_features,) 特征分數的p值。 |
另見
標簽和特征之間的ANOVA F值,用于分類任務。
離散目標的相互信息。
分類任務的非負特征的卡方統計。
回歸任務的標簽和特征之間的F值。
連續目標的相互信息。
根據最高分數的百分位數選擇特征。
根據k個最高分數選擇特征。
根據誤報率測試選擇特征。
根據多重比較錯誤率選擇特征。
具有可配置模式的單變量特征選擇器。
參考
https://zh.wikipedia.org/wiki/False_discovery_rate
示例
>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import SelectFdr, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y)
>>> X_new.shape
(569, 16)
方法
方法 | 說明 |
---|---|
fit (X, y) |
在(X,y)上運行score函數并獲得適當的特征。 |
fit_transform (X[, y]) |
擬合數據,然后對其進行轉換。 |
get_params ([deep]) |
獲取此估計器的參數。 |
get_support ([indices]) |
獲取所選特征的掩碼或整數索引。 |
inverse_transform (X) |
反向轉換操作 |
set_params (**params) |
設置此估計器的參數。 |
transform (X) |
將X縮小為選定的特征。 |
__init__(score_func=<function f_classif>, *, alpha=0.05)
初始化self,參見help(type(self))獲取更多信息。
fit(X, y)
在(X, y)上運行score函數,得到相應的特征。
參數 | 說明 |
---|---|
X | array-like of shape (n_samples, n_features) 訓練樣本。 |
y | array-like of shape (n_samples,) 目標值(分類中的類標簽,回歸中的真實值)。 |
返回值 | 說明 |
---|---|
self | object |
fit_transform(X, y=None, **fit_params)
擬合數據,然后對其進行轉換。
使用可選參數fit_params將轉換器擬合到X和y,并返回X的轉換值。
參數 | 說明 |
---|---|
X | {array-like, sparse matrix, dataframe} of shape (n_samples, n_features) |
y | ndarray of shape (n_samples,), default=None 目標值 |
**fit_params | dict 其他擬合參數。 |
返回值 | 說明 |
---|---|
X_new | ndarray array of shape (n_samples, n_features_new) 轉換后的數組。 |
get_params(deep=True)
獲取此估計器的參數。
參數 | 說明 |
---|---|
deep | bool, default=True 如果為True,則將返回此估算器和所包含子對象的參數。 |
返回值 | 說明 |
---|---|
params | mapping of string to any 參數名稱映射到其值。 |
get_support(indices=False)
獲取所選特征的掩碼或整數索引。
參數 | 說明 |
---|---|
indices | boolean (default False) 如果為True,則返回值將是一個整數數組,而不是布爾掩碼。 |
返回值 | 說明 |
---|---|
support | array 從特征向量中選擇保留特征的索引。如果 indices 為False,則為形狀為[#輸入特征]的布爾數組,其中元素為True時(如果已選擇其對應的特征進行保留)。如果indices 為True,則這是一個形狀為[#輸出特征]的整數數組,其值是輸入特征向量的索引。 |
inverse_transform(X)
反向轉換操作。
參數 | 說明 |
---|---|
X | array of shape [n_samples, n_selected_features] 輸入樣本。 |
返回值 | 說明 |
---|---|
X_r | array of shape [n_samples, n_original_features]X 中插入的列名為零的特征將被transform 刪除。 |
set_params(**params)
設置此估算器的參數。
該方法適用于簡單的估計器以及嵌套對象(例如管道)。后者具有<component>__<parameter>
形式的參數, 以便可以更新嵌套對象的每個組件。
參數 | 說明 |
---|---|
**params | dict 估計器參數。 |
返回值 | 說明 |
---|---|
self | object 估計器實例。 |
transform(X)
將X縮小為選定的特征。
參數 | 說明 |
---|---|
X | array of shape [n_samples, n_features] 輸入樣本。 |
返回值 | 說明 |
---|---|
X_r | array of shape [n_samples, n_selected_features] 僅具有所選特征的輸入樣本。 |