sklearn.feature_selection.VarianceThreshold?

class sklearn.feature_selection.VarianceThreshold(threshold=0.0)

[源碼]

刪除所有低方差特征的特征選擇器。

此特征選擇算法僅查看特征(X),而不查看所需的輸出(y),因此可用于無監督學習。

用戶指南中閱讀更多內容。

參數 說明
threshold float, optional
訓練集方差低于此閾值的特征將被刪除。默認設置是保留所有具有非零方差的特征,即刪除所有樣本中具有相同值的特征。
屬性 說明
variances_ array, shape (n_features,)

在輸入中允許使用NaN。

示例

下面的數據集具有整數特征,每個樣本中有兩個特征是相同的。這些是使用閾值的默認設置刪除的:

>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
>>> selector = VarianceThreshold()
>>> selector.fit_transform(X)
array([[2, 0],
       [1, 4],
       [1, 1]])

方法

方法 說明
fit(X[, y]) 從X中學習經驗方差。
fit_transform(X[, y]) 擬合數據,然后對其進行轉換。
get_params([deep]) 獲取此估計器的參數。
get_support([indices]) 獲取所選特征的掩碼或整數索引。
inverse_transform(X) 反向轉換操作
set_params(**params) 設置此估計器的參數。
transform(X) 將X縮小為選定的特征。
__init__(threshold=0.0)

[源碼]

初始化self,參見help(type(self))獲取更多信息。

fit(X, y=None)

[源碼]

從X中學習經驗方差。

參數 說明
X {array-like, sparse matrix}, shape (n_samples, n_features)
用于計算方差的樣本向量。
y any
忽略。存在此參數是為了與sklearn.pipeline.Pipeline兼容。
返回值 說明
self
fit_transform(X, y=None, **fit_params)

[源碼]

擬合數據,然后對其進行轉換。

使用可選參數fit_params將轉換器擬合到X和y,并返回X的轉換值。

參數 說明
X {array-like, sparse matrix, dataframe} of shape (n_samples, n_features)
y ndarray of shape (n_samples,), default=None
目標值
**fit_params dict
其他擬合參數。
返回值 說明
X_new ndarray array of shape (n_samples, n_features_new)
轉換后的數組。
get_params(deep=True)

[源碼]

獲取此估計器的參數。

參數 說明
deep bool, default=True
如果為True,則將返回此估算器和所包含子對象的參數。
返回值 說明
params mapping of string to any
參數名稱映射到其值。
get_support(indices=False)

[源碼]

獲取所選特征的掩碼或整數索引。

參數 說明
indices boolean (default False)
如果為True,則返回值將是一個整數數組,而不是布爾掩碼。
返回值 說明
support array
從特征向量中選擇保留特征的索引。如果indices為False,則為形狀為[#輸入特征]的布爾數組,其中元素為True時(如果已選擇其對應的特征進行保留)。如果indices為True,則這是一個形狀為[#輸出特征]的整數數組,其值是輸入特征向量的索引。
inverse_transform(X)

[源碼]

反向轉換操作。

參數 說明
X array of shape [n_samples, n_selected_features]
輸入樣本。
返回值 說明
X_r array of shape [n_samples, n_original_features]
X中插入的列名為零的特征將被transform刪除。
set_params(**params)

[源碼]

設置此估算器的參數。

該方法適用于簡單的估計器以及嵌套對象(例如管道)。后者具有<component>__<parameter>形式的參數, 以便可以更新嵌套對象的每個組件。

參數 說明
**params dict
估計器參數。
返回值 說明
self object
估計器實例。
transform(X)

[源碼]

將X縮小為選定的特征。

參數 說明
X array of shape [n_samples, n_features]
輸入樣本。
返回值 說明
X_r array of shape [n_samples, n_selected_features]
僅具有所選特征的輸入樣本。