sklearn.preprocessing.MinMaxScaler?
class sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True)
通過將每個要素縮放到給定范圍來變換要素。
該估計器分別縮放和轉換每個特征,以使其在訓練集上處于給定范圍內,例如介于零和一之間。
轉換方式為:
X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min
最小,最大= feature_range。
此變換通常用作零均值,單位方差縮放的替代方法。
閱讀更多內容參見用戶指南。
參數 | 說明 |
---|---|
feature_range | tuple (min, max), default=(0, 1) 所需的轉換數據范圍。 |
copy | bool, default=True 設置為False可以執行就地行規范化并避免復制(如果輸入已經是numpy數組)。 |
屬性 | 說明 |
---|---|
min_ | ndarray of shape (n_features,) 每個功能調整的最小值。等效于min-X.min(axis = 0)* self.scale_ |
scale_ | ndarray of shape (n_features,) 每個要素的數據相對縮放。相當于(max - min) / (X.max(axis=0) - X.min(axis=0)) 0.17版中的新功能:scale_屬性。 |
data_min_ | ndarray of shape (n_features,) 數據中顯示的每個功能最小值 0.17版中的新功能:data_min_ |
data_range_ | ndarray of shape (n_features,) 數據中看到的每個要素范圍(data_max_-data_min_) 0.17版中的新功能:data_range_ |
n_samples_seen_ | int 估計器處理的樣本數。它將在新的調用中重置為fit,但會在partial_fit調用中遞增。 |
另見:
沒有估算器API的等效函數。
注釋
NaN被視為缺失值:忽略適合度,并保持變換值。
有關不同縮放器,轉換器和規范化器的比較,請參閱examples/preprocessing/plot_all_scaling.py。
示例
>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0. 0. ]
[0.25 0.25]
[0.5 0.5 ]
[1. 1. ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]
方法
方法 | 說明 |
---|---|
fit (X[, y]) |
計算用于以后縮放的最小值和最大值。 |
fit_transform (X[, y]) |
擬合數據,然后對其進行轉換。 |
get_params ([deep]) |
獲取此估計量的參數。 |
inverse_transform (X) |
根據feature_range撤消X的縮放比例。 |
partial_fit (X[, y]) |
在線計算X上的最小值和最大值,以便以后縮放。 |
set_params (**params) |
設置此估算器的參數。 |
transform (X) |
根據feature_range縮放X的要素。 |
__init__(feature_range=(0, 1), *, copy=True)
初始化self,有關準確的簽名,請參見help(type(self))。
fit(X, y=None)
計算用于以后縮放的最小值和最大值。
參數 | 說明 |
---|---|
X | array-like of shape (n_samples, n_features) 該數據用于計算每個特征的最小值和最大值,以用于以后沿特征軸縮放。 |
y | None 忽略。 |
返回值 | 說明 |
---|---|
self | object 合適的定標器。 |
fit_transform(X, y=None, **fit_params)
擬合數據,然后對其進行轉換。
使用可選參數fit_params將轉換器擬合到X和y,并返回X的轉換版本。
參數 | 說明 |
---|---|
X | {array-like, sparse matrix, dataframe} of shape (n_samples, n_features) |
y | ndarray of shape (n_samples,), default=None 目標值。 |
**fit_params | dict 其他擬合參數。 |
返回值 | 說明 |
---|---|
X_new | ndarray array of shape (n_samples, n_features_new) 轉換后的數組。 |
get_params(deep=True)
獲取此估計量的參數。
參數 | 說明 |
---|---|
deep | bool, default=True 如果為True,則將返回此估算器和作為估算器的所包含子對象的參數。 |
返回值 | 說明 |
---|---|
params | mapping of string to any 參數名稱映射到其值。 |
inverse_transform(X)
根據feature_range撤消X的縮放比例。
參數 | 說明 |
---|---|
X | array-like of shape (n_samples, n_features) 輸入將要轉換的數據。不能稀疏。 |
返回值 | 說明 |
---|---|
Xt | array-like of shape (n_samples, n_features) 轉換后的數據。 |
partial_fit(X, y=None)
在線計算X上的最小值和最大值,以便以后縮放。
所有X都作為一個批處理。這適用于由于n_sample數量過多或從連續流中讀取X而無法進行擬合的情況。
參數 | 說明 |
---|---|
X | array-like of shape (n_samples, n_features) 該數據用于計算每個特征的最小值和最大值,以用于以后沿特征軸縮放。 |
y | None 忽略。 |
返回值 | 說明 |
---|---|
self | object 合適的定標器。 |
set_params(**params)
設置此估算器的參數。
該方法適用于簡單的估計器以及嵌套對象(例如管道)。后者的參數形式為<component>__<parameter>這樣就可以更新嵌套對象的每個組件。
參數 | 說明 |
---|---|
**params | dict 估算器參數。 |
返回值 | 說明 |
---|---|
self | object 合適的定標器。 |
transform(X)
根據feature_range縮放X的要素。
參數 | 說明 |
---|---|
X | array-like of shape (n_samples, n_features) 輸入將要轉換的數據。不能稀疏。 |
返回值 | 說明 |
---|---|
Xt | array-like of shape (n_samples, n_features) 轉換后的數據。 |