sklearn.pipeline.FeatureUnion?
class sklearn.pipeline.FeatureUnion(transformer_list, *, n_jobs=None, transformer_weights=None, verbose=False)
連接多個轉換器對象的結果。
這個估計器將轉換器對象列表與輸入數據并行應用,然后合并結果。這對于將多個特征提取機制組合到單個轉換器中很有用。
可以使用轉換器名稱和以“__”分隔的參數名稱來設置轉換器的參數。可以通過將參數的名稱設置為另一個轉換器來完全替換一個轉換器,也可以通過將其設置為“ drop”來刪除它。
在用戶指南中閱讀更多內容。
版本0.13中的新功能。
參數 | 說明 |
---|---|
transformer_list | list of (string, transformer) tuples 要應用于數據的轉換器對象列表。每個元組的前半部分是轉換器的名稱。 在0.22版中進行了更改:==不建議設置 None 因為轉換器支持“ drop”。== |
n_jobs | int, default=None 要并行運行的CPU數。 None 除非在joblib.parallel_backend 環境中,否則表示1 。 -1 表示使用所有處理器。有關 更多詳細信息,請參見詞匯表。v0.20版中的更改: n_jobs 默認從1更改為None |
transformer_weights | dict, default=None 每個轉換器的特征權重。鍵是轉換器名稱,權重值。 |
verbose | bool, default=False 如果為True,則在完成擬合時將會打印擬合每個轉換器時所經過的時間。 |
屬性 |
---|
n_features_in_ |
另見:
sklearn.pipeline.make_union
便利的函數可簡化特征合并結構。
示例
>>> from sklearn.pipeline import FeatureUnion
>>> from sklearn.decomposition import PCA, TruncatedSVD
>>> union = FeatureUnion([("pca", PCA(n_components=1)),
... ("svd", TruncatedSVD(n_components=2))])
>>> X = [[0., 1., 3], [2., 2., 5]]
>>> union.fit_transform(X)
array([[ 1.5 , 3.0..., 0.8...],
[-1.5 , 5.7..., -0.4...]])
方法
方法 | 說明 |
---|---|
fit (X[, y]) |
使用X擬合所有轉換器 |
fit_transform (X[, y]) |
擬合所有轉換器,轉換數據并連接結果 |
get_feature_names () |
獲取所有轉換器的特征名稱。 |
get_params ([deep]) |
獲取這個估計器的參數。 |
set_params (**kwargs) |
為這個估計器設置參數。 |
transform (X) |
由每個轉換器分別轉換X,連接結果 |
__init__(transformer_list, *, n_jobs=None, transformer_weights=None, verbose=False)
[源碼]
初始化self。詳情可參閱 type(self)的幫助。
fit(X, y=None, **fit_params)
[源碼]
使用X擬合所有轉換器
參數 | 說明 |
---|---|
X | iterable or array-like, depending on transformers 輸入要轉換的數據。 |
y | array-like of shape (n_samples, n_outputs), default=None 監督學習的標簽 |
返回值 | 說明 |
---|---|
self | FeatureUnion 這個估計器 |
fit_transform(X, y=None, **fit_params)
[源碼]
擬合所有轉換器,轉換數據并連接結果
參數 | 說明 |
---|---|
X | iterable or array-like, depending on transformers 輸入要轉換的數據。 |
y | array-like of shape (n_samples, n_outputs), default=None 監督學習的標簽 |
返回值 | 說明 |
---|---|
X_t | array-like or sparse matrix of shape (n_samples, sum_n_components) transformers. sum_n_components橫向拼接的結果是轉換器上n_components(輸出維數)的和。 |
get_feature_names()
[源碼]
獲取所有轉換器的特征名稱。
返回值 | 說明 |
---|---|
feature_names | list of strings 轉換產生的特征的名稱。 |
get_params(deep=True)
[源碼]
獲取這個估計器的參數。
參數 | 說明 |
---|---|
deep | bool, default=True 如果為True,則將返回這個估計器的參數和所包含的估計器子對象。 |
返回值 | 說明 |
---|---|
params | mapping of string to any 參數名映射到其值 |
set_params(**kwargs)
[源碼]
為這個估計器設置參數。
有效的參數鍵可以用get_params()
列出。
返回值 |
---|
self |
transform(X)
[源碼]
由每個轉換器分別轉換X,連接結果
參數 | 說明 |
---|---|
X | iterable or array-like, depending on transformers 輸入要轉換的數據。 |
返回值 | 說明 |
---|---|
X_t | array-like or sparse matrix of shape (n_samples, sum_n_components) transformers. sum_n_components橫向拼接的結果是轉換器上n_components(輸出維數)的和。 |