sklearn.preprocessing.robust_scale?

sklearn.preprocessing.robust_scale(X, *, axis=0, with_centering=True, with_scaling=True, quantile_range=(25.075.0), copy=True)

[源碼]

沿任何軸標準化數據集

根據四分位數范圍,以中位數和分量明智規模為中心。

用戶指南中閱讀更多內容。

參數 說明
X array-like
數據要居中和縮放。
axis int (0 by default)
用于計算中位數和IQR的軸。如果為0,則分別縮放每個特征,否則(如果為1)縮放每個樣本。
with_centering boolean, True by default
如果為True,則在縮放之前將數據居中。
with_scaling boolean, True by default
如果為True,則將數據縮放到單位方差(或等效地,單位標準偏差)。
quantile_range tuple (q_min, q_max), 0.0 < q_min < q_max < 100.0
默認值:(25.0,75.0)=(第一分位數,第三分位數)= IQR用于計算scale_的分位數范圍。
版本0.18中的新功能。
copy boolean, optional, default is True
設置為False可以執行就地行規范化并避免復制(如果輸入已經是numpy數組或scipy.sparse CSR矩陣,并且軸為1)。

另見:

RobustScaler

使用Transformer API(例如,作為預處理 sklearn.pipeline.Pipeline的一部分)執行居中和縮放。

注釋

此實現將拒絕使scipy.sparse矩陣居中,因為這會使它們變得稀疏,并可能因內存耗盡問題而使程序崩潰。

相反,調用者要么顯式設置為_centering=False(在這種情況下,只有對CSR矩陣的特征執行方差縮放),要么調用X.toarray(),如果他/她希望物化密集數組適合內存。

為避免內存復制,調用者應傳遞一個CSR矩陣。

有關不同縮放器,轉換器和規范化器的比較,請參閱examples/preprocessing/plot_all_scaling.py