sklearn.preprocessing.MinMaxScaler?

class sklearn.preprocessing.MinMaxScaler(feature_range=(01), *, copy=True)

通過將每個要素縮放到給定范圍來變換要素。

該估計器分別縮放和轉換每個特征,以使其在訓練集上處于給定范圍內,例如介于零和一之間。

轉換方式為:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

最小,最大= feature_range。

此變換通常用作零均值,單位方差縮放的替代方法。

閱讀更多內容參見用戶指南

參數 說明
feature_range tuple (min, max), default=(0, 1)
所需的轉換數據范圍。
copy bool, default=True
設置為False可以執行就地行規范化并避免復制(如果輸入已經是numpy數組)。
屬性 說明
min_ ndarray of shape (n_features,)
每個功能調整的最小值。等效于min-X.min(axis = 0)* self.scale_
scale_ ndarray of shape (n_features,)
每個要素的數據相對縮放。相當于(max - min) / (X.max(axis=0) - X.min(axis=0))
0.17版中的新功能:scale_屬性。
data_min_ ndarray of shape (n_features,)
數據中顯示的每個功能最小值
0.17版中的新功能:data_min_
data_range_ ndarray of shape (n_features,)
數據中看到的每個要素范圍(data_max_-data_min_)
0.17版中的新功能:data_range_
n_samples_seen_ int
估計器處理的樣本數。它將在新的調用中重置為fit,但會在partial_fit調用中遞增。

另見:

minmax_scale

沒有估算器API的等效函數。

注釋

NaN被視為缺失值:忽略適合度,并保持變換值。

有關不同縮放器,轉換器和規范化器的比較,請參閱examples/preprocessing/plot_all_scaling.py

示例

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-12], [-0.56], [010], [118]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[22]]))
[[1.5 0. ]]

方法

方法 說明
fit(X[, y]) 計算用于以后縮放的最小值和最大值。
fit_transform(X[, y]) 擬合數據,然后對其進行轉換。
get_params([deep]) 獲取此估計量的參數。
inverse_transform(X) 根據feature_range撤消X的縮放比例。
partial_fit(X[, y]) 在線計算X上的最小值和最大值,以便以后縮放。
set_params(**params) 設置此估算器的參數。
transform(X) 根據feature_range縮放X的要素。
__init__(feature_range=(01), *, copy=True)

[源碼]

初始化self,有關準確的簽名,請參見help(type(self))。

fit(X, y=None)

[源碼]

計算用于以后縮放的最小值和最大值。

參數 說明
X array-like of shape (n_samples, n_features)
該數據用于計算每個特征的最小值和最大值,以用于以后沿特征軸縮放。
y None
忽略。
返回值 說明
self object
合適的定標器。
fit_transform(X, y=None, **fit_params)

[源碼]

擬合數據,然后對其進行轉換。

使用可選參數fit_params將轉換器擬合到X和y,并返回X的轉換版本。

參數 說明
X {array-like, sparse matrix, dataframe} of shape (n_samples, n_features)
y ndarray of shape (n_samples,), default=None
目標值。
**fit_params dict
其他擬合參數。
返回值 說明
X_new ndarray array of shape (n_samples, n_features_new)
轉換后的數組。
get_params(deep=True)

[源碼]

獲取此估計量的參數。

參數 說明
deep bool, default=True
如果為True,則將返回此估算器和作為估算器的所包含子對象的參數。
返回值 說明
params mapping of string to any
參數名稱映射到其值。
inverse_transform(X)

[源碼]

根據feature_range撤消X的縮放比例。

參數 說明
X array-like of shape (n_samples, n_features)
輸入將要轉換的數據。不能稀疏。
返回值 說明
Xt array-like of shape (n_samples, n_features)
轉換后的數據。
partial_fit(X, y=None)

[源碼]

在線計算X上的最小值和最大值,以便以后縮放。

所有X都作為一個批處理。這適用于由于n_sample數量過多或從連續流中讀取X而無法進行擬合的情況。

參數 說明
X array-like of shape (n_samples, n_features)
該數據用于計算每個特征的最小值和最大值,以用于以后沿特征軸縮放。
y None
忽略。
返回值 說明
self object
合適的定標器。
set_params(**params)

[源碼]

設置此估算器的參數。

該方法適用于簡單的估計器以及嵌套對象(例如管道)。后者的參數形式為<component>__<parameter>這樣就可以更新嵌套對象的每個組件。

參數 說明
**params dict
估算器參數。
返回值 說明
self object
合適的定標器。
transform(X)

[源碼]

根據feature_range縮放X的要素。

參數 說明
X array-like of shape (n_samples, n_features)
輸入將要轉換的數據。不能稀疏。
返回值 說明
Xt array-like of shape (n_samples, n_features)
轉換后的數據。