sklearn.feature_selection.VarianceThreshold?
class sklearn.feature_selection.VarianceThreshold(threshold=0.0)
刪除所有低方差特征的特征選擇器。
此特征選擇算法僅查看特征(X),而不查看所需的輸出(y),因此可用于無監督學習。
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
threshold | float, optional 訓練集方差低于此閾值的特征將被刪除。默認設置是保留所有具有非零方差的特征,即刪除所有樣本中具有相同值的特征。 |
屬性 | 說明 |
---|---|
variances_ | array, shape (n_features,) |
注
在輸入中允許使用NaN。
示例
下面的數據集具有整數特征,每個樣本中有兩個特征是相同的。這些是使用閾值的默認設置刪除的:
>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
>>> selector = VarianceThreshold()
>>> selector.fit_transform(X)
array([[2, 0],
[1, 4],
[1, 1]])
方法
方法 | 說明 |
---|---|
fit (X[, y]) |
從X中學習經驗方差。 |
fit_transform (X[, y]) |
擬合數據,然后對其進行轉換。 |
get_params ([deep]) |
獲取此估計器的參數。 |
get_support ([indices]) |
獲取所選特征的掩碼或整數索引。 |
inverse_transform (X) |
反向轉換操作 |
set_params (**params) |
設置此估計器的參數。 |
transform (X) |
將X縮小為選定的特征。 |
__init__(threshold=0.0)
初始化self,參見help(type(self))獲取更多信息。
fit(X, y=None)
從X中學習經驗方差。
參數 | 說明 |
---|---|
X | {array-like, sparse matrix}, shape (n_samples, n_features) 用于計算方差的樣本向量。 |
y | any 忽略。存在此參數是為了與sklearn.pipeline.Pipeline兼容。 |
返回值 | 說明 |
---|---|
self |
fit_transform(X, y=None, **fit_params)
擬合數據,然后對其進行轉換。
使用可選參數fit_params將轉換器擬合到X和y,并返回X的轉換值。
參數 | 說明 |
---|---|
X | {array-like, sparse matrix, dataframe} of shape (n_samples, n_features) |
y | ndarray of shape (n_samples,), default=None 目標值 |
**fit_params | dict 其他擬合參數。 |
返回值 | 說明 |
---|---|
X_new | ndarray array of shape (n_samples, n_features_new) 轉換后的數組。 |
get_params(deep=True)
獲取此估計器的參數。
參數 | 說明 |
---|---|
deep | bool, default=True 如果為True,則將返回此估算器和所包含子對象的參數。 |
返回值 | 說明 |
---|---|
params | mapping of string to any 參數名稱映射到其值。 |
get_support(indices=False)
獲取所選特征的掩碼或整數索引。
參數 | 說明 |
---|---|
indices | boolean (default False) 如果為True,則返回值將是一個整數數組,而不是布爾掩碼。 |
返回值 | 說明 |
---|---|
support | array 從特征向量中選擇保留特征的索引。如果 indices 為False,則為形狀為[#輸入特征]的布爾數組,其中元素為True時(如果已選擇其對應的特征進行保留)。如果indices 為True,則這是一個形狀為[#輸出特征]的整數數組,其值是輸入特征向量的索引。 |
inverse_transform(X)
反向轉換操作。
參數 | 說明 |
---|---|
X | array of shape [n_samples, n_selected_features] 輸入樣本。 |
返回值 | 說明 |
---|---|
X_r | array of shape [n_samples, n_original_features]X 中插入的列名為零的特征將被transform 刪除。 |
set_params(**params)
設置此估算器的參數。
該方法適用于簡單的估計器以及嵌套對象(例如管道)。后者具有<component>__<parameter>
形式的參數, 以便可以更新嵌套對象的每個組件。
參數 | 說明 |
---|---|
**params | dict 估計器參數。 |
返回值 | 說明 |
---|---|
self | object 估計器實例。 |
transform(X)
將X縮小為選定的特征。
參數 | 說明 |
---|---|
X | array of shape [n_samples, n_features] 輸入樣本。 |
返回值 | 說明 |
---|---|
X_r | array of shape [n_samples, n_selected_features] 僅具有所選特征的輸入樣本。 |