sklearn.preprocessing.Normalizer?
class sklearn.preprocessing.Normalizer(norm='l2', *, copy=True)
將樣本分別歸一化為單位范數。
具有至少一個非零分量的每個樣本(即數據矩陣的每一行)都獨立于其他樣本進行重新縮放,以使其范數(l1,l2或inf)等于1。
該轉換器可以使用密集的numpy數組和scipy.sparse矩陣(如果要避免復制/轉換的負擔,請使用CSR格式)。
例如,將輸入縮放到單位范數是文本分類或聚類的常見操作。例如,兩個十二個標準化TF-IDF向量的點積是向量的余弦相似度,并且是信息檢索社區通常使用的向量空間模型的基本相似度。
閱讀更多內容參見用戶指南。
參數 | 說明 |
---|---|
norm | 用于規范化每個非零樣本的范數。 如果使用norm ='max',則將按絕對值的最大值重新縮放值。 |
copy | boolean, optional, default True 設置為False可以執行就地行規范化并避免復制(如果輸入已經是numpy數組或scipy.sparse CSR矩陣)。 |
另見:
沒有估算器API的等效函數。
示例
該估計器是無狀態的(除了構造函數參數之外),fit方法什么也不做,但是在管道中使用時很有用。
有關不同縮放器,轉換器和歸一化器的比較,請參見examples/preprocessing/plot_all_scaling.py。
示例
>>> from sklearn.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
... [1, 3, 9, 3],
... [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X) # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
[0.1, 0.3, 0.9, 0.3],
[0.5, 0.7, 0.5, 0.1]])
方法
方法 | 說明 |
---|---|
fit (X[, y]) |
不執行任何操作,并使估算器保持不變 |
fit_transform (X[, y]) |
擬合數據,然后對其進行轉換。 |
get_params ([deep]) |
獲取此估計量的參數。 |
set_params (**params) |
設置此估算器的參數。 |
transform (X[, copy]) |
將X的每個非零行縮放為單位范數 |
__init__(norm='l2', *, copy=True)
始化self,有關準確的簽名,請參見help(type(self))。
fit(X, y=None)
不執行任何操作,并使估算器保持不變
該方法僅用于實現常規API,因此可以在管道中使用。
參數 | 說明 |
---|---|
X | array-like |
fit_transform(X, y=None, **fit_params)
擬合數據,然后對其進行轉換。
使用可選參數fit_params將轉換器擬合到X和y,并返回X的轉換版本。
參數 | 說明 |
---|---|
X | {array-like, sparse matrix, dataframe} of shape (n_samples, n_features) |
y | ndarray of shape (n_samples,), default=None 目標值。 |
**fit_params | dict 其他擬合參數。 |
返回值 | 說明 |
---|---|
X_new | ndarray array of shape (n_samples, n_features_new) 轉換后的數組。 |
get_params(deep=True)
獲取此估計量的參數。
參數 | 說明 |
---|---|
deep | bool, default=True 如果為True,則將返回此估算器和作為估算器的所包含子對象的參數。 |
返回值 | 說明 |
---|---|
params | mapping of string to any 參數名稱映射到其值。 |
set_params(**params)
設置此估算器的參數。
該方法適用于簡單的估計器以及嵌套對象(例如管道)。后者的參數形<component>__<parameter>這樣就可以更新嵌套對象的每個組件。
參數 | 說明 |
---|---|
**params | dict 估算器參數。 |
返回值 | 說明 |
---|---|
self | object 估算器實例。 |
transform(X, copy=None)
將X的每個非零行縮放為單位范數
參數 | 說明 |
---|---|
X | {array-like, sparse matrix}, shape [n_samples, n_features] 要逐行標準化的數據。scipy.sparse矩陣應采用CSR格式,以避免不必要的復制。 |
返回值 | 說明 |
---|---|
copy | bool, optional (default: None) 是否復制輸入X。 |