sklearn.preprocessing.robust_scale?
sklearn.preprocessing.robust_scale(X, *, axis=0, with_centering=True, with_scaling=True, quantile_range=(25.0, 75.0), copy=True)
沿任何軸標準化數據集
根據四分位數范圍,以中位數和分量明智規模為中心。
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
X | array-like 數據要居中和縮放。 |
axis | int (0 by default) 用于計算中位數和IQR的軸。如果為0,則分別縮放每個特征,否則(如果為1)縮放每個樣本。 |
with_centering | boolean, True by default 如果為True,則在縮放之前將數據居中。 |
with_scaling | boolean, True by default 如果為True,則將數據縮放到單位方差(或等效地,單位標準偏差)。 |
quantile_range | tuple (q_min, q_max), 0.0 < q_min < q_max < 100.0 默認值:(25.0,75.0)=(第一分位數,第三分位數)= IQR用于計算scale_的分位數范圍。 版本0.18中的新功能。 |
copy | boolean, optional, default is True 設置為False可以執行就地行規范化并避免復制(如果輸入已經是numpy數組或scipy.sparse CSR矩陣,并且軸為1)。 |
另見:
使用Transformer API(例如,作為預處理 sklearn.pipeline.Pipeline
的一部分)執行居中和縮放。
注釋
此實現將拒絕使scipy.sparse矩陣居中,因為這會使它們變得稀疏,并可能因內存耗盡問題而使程序崩潰。
相反,調用者要么顯式設置為_centering=False(在這種情況下,只有對CSR矩陣的特征執行方差縮放),要么調用X.toarray(),如果他/她希望物化密集數組適合內存。
為避免內存復制,調用者應傳遞一個CSR矩陣。
有關不同縮放器,轉換器和規范化器的比較,請參閱examples/preprocessing/plot_all_scaling.py。