sklearn.pipeline.FeatureUnion?

class sklearn.pipeline.FeatureUnion(transformer_list, *, n_jobs=None, transformer_weights=None, verbose=False)

連接多個轉換器對象的結果。

這個估計器將轉換器對象列表與輸入數據并行應用,然后合并結果。這對于將多個特征提取機制組合到單個轉換器中很有用。

可以使用轉換器名稱和以“__”分隔的參數名稱來設置轉換器的參數。可以通過將參數的名稱設置為另一個轉換器來完全替換一個轉換器,也可以通過將其設置為“ drop”來刪除它。

用戶指南中閱讀更多內容。

版本0.13中的新功能。

參數 說明
transformer_list list of (string, transformer) tuples
要應用于數據的轉換器對象列表。每個元組的前半部分是轉換器的名稱。

在0.22版中進行了更改:==不建議設置None因為轉換器支持“ drop”。==
n_jobs int, default=None
要并行運行的CPU數。 None除非在joblib.parallel_backend環境中,否則表示1 。 -1表示使用所有處理器。有關 更多詳細信息,請參見詞匯表

v0.20版中的更改:n_jobs默認從1更改為None
transformer_weights dict, default=None
每個轉換器的特征權重。鍵是轉換器名稱,權重值。
verbose bool, default=False
如果為True,則在完成擬合時將會打印擬合每個轉換器時所經過的時間。
屬性
n_features_in_

另見:

sklearn.pipeline.make_union 便利的函數可簡化特征合并結構。

示例

>>> from sklearn.pipeline import FeatureUnion
>>> from sklearn.decomposition import PCA, TruncatedSVD
>>> union = FeatureUnion([("pca", PCA(n_components=1)),
...                       ("svd", TruncatedSVD(n_components=2))])
>>> X = [[0.1.3], [2.2.5]]
>>> union.fit_transform(X)
array([[ 1.5       ,  3.0...,  0.8...],
       [-1.5       ,  5.7..., -0.4...]])

方法

方法 說明
fit(X[, y]) 使用X擬合所有轉換器
fit_transform(X[, y]) 擬合所有轉換器,轉換數據并連接結果
get_feature_names() 獲取所有轉換器的特征名稱。
get_params([deep]) 獲取這個估計器的參數。
set_params(**kwargs) 為這個估計器設置參數。
transform(X) 由每個轉換器分別轉換X,連接結果
__init__(transformer_list, *, n_jobs=None, transformer_weights=None, verbose=False)

[源碼]

初始化self。詳情可參閱 type(self)的幫助。

fit(X, y=None, **fit_params)

[源碼]

使用X擬合所有轉換器

參數 說明
X iterable or array-like, depending on transformers
輸入要轉換的數據。
y array-like of shape (n_samples, n_outputs), default=None
監督學習的標簽
返回值 說明
self FeatureUnion
這個估計器
fit_transform(X, y=None, **fit_params)

[源碼]

擬合所有轉換器,轉換數據并連接結果

參數 說明
X iterable or array-like, depending on transformers
輸入要轉換的數據。
y array-like of shape (n_samples, n_outputs), default=None
監督學習的標簽
返回值 說明
X_t array-like or sparse matrix of shape (n_samples, sum_n_components)
transformers. sum_n_components橫向拼接的結果是轉換器上n_components(輸出維數)的和。
get_feature_names()

[源碼]

獲取所有轉換器的特征名稱。

返回值 說明
feature_names list of strings
轉換產生的特征的名稱。
get_params(deep=True)

[源碼]

獲取這個估計器的參數。

參數 說明
deep bool, default=True
如果為True,則將返回這個估計器的參數和所包含的估計器子對象。
返回值 說明
params mapping of string to any
參數名映射到其值
set_params(**kwargs)

[源碼]

為這個估計器設置參數。

有效的參數鍵可以用get_params()列出。

返回值
self
transform(X)

[源碼]

由每個轉換器分別轉換X,連接結果

參數 說明
X iterable or array-like, depending on transformers
輸入要轉換的數據。
返回值 說明
X_t array-like or sparse matrix of shape (n_samples, sum_n_components)
transformers. sum_n_components橫向拼接的結果是轉換器上n_components(輸出維數)的和。

sklearn.pipeline.FeatureUnion使用示例?