sklearn.utils.check_array?
sklearn.utils.check_array(array, accept_sparse=False, *, accept_large_sparse=True, dtype='numeric', order=None, copy=False, force_all_finite=True, ensure_2d=True, allow_nd=False, ensure_min_samples=1, ensure_min_features=1, estimator=None)
對數組,列表,稀疏矩陣或類似內容進行輸入驗證。
默認情況下,輸入被檢查的值僅包含有限值的非空2D數組。 如果數組的dtype是object,則嘗試轉換為float,失敗時引發錯誤。
參數 | 說明 |
---|---|
array | object 輸入對象進行檢查/轉換。 |
accept_sparse | string, boolean or list of string (default=False) 表示允許稀疏矩陣格式的字符串,如csc, csr等。如果輸入是稀疏的,但不是允許的格式,它將被轉換為第一種列出的格式。True允許輸入任何格式。False表示如果是稀疏矩陣輸入會產生錯誤。 |
accept_large_sparse | bool (default=True) 如果提供了CSR,CSC,COO或BSR稀疏矩陣并被accept_sparse接受,則accept_large_sparse僅當其索引為32位dtype存儲時才會被接受。 是0.20版中的新功能。 |
dtype | string, type, list of types or None (default=”numeric”) 返回結果的數據類型。 如果為None,則保留輸入的dtype。 如果為“ numeric”,則除非array.dtype是object,否則將保留dtype。 如果dtype是類型列表,則僅當輸入的dtype不在列表中時,才對第一個類型進行轉換。 |
order | ‘F’, ‘C’ or None (default=None) 設置數組將被強制為fortran還是c樣式 |
copy | boolean (default=False) 是否觸發強制復制。 如果copy = False,則轉換可能會觸發復制。 |
force_all_finite | boolean or ‘allow-nan’, (default=True) 是否在X為np.inf,np.nan,pd.NA時引發錯誤。可能性為: True:強制X的所有值都是有限制的。 False:在X中接受np.inf,np.nan,pd.NA。 “ allow-nan”:僅接受X中的np.nan和pd.NA值。值不能為無限的。 0.20版中的新功能:force_all_finite接受字符串“ allow-nan”。 在版本0.23中更改:接受pd.NA并將其轉換為np.nan |
ensure_2d | boolean (default=True) 如果X不是2D,是否引發值錯誤。 |
allow_nd | boolean (default=False) 是否允許X.ndim> 2。 |
ensure_min_samples | int (default=1) 確保X在其第一個軸上具有最少數量的樣本(二維數組的行)。 |
ensure_min_features | int (default=1) 確保2D陣列具有最少數量的特征(列)。 默認值1表示拒絕空數據集。 僅當X有效具有2維或最初為1D并確保2d為True時,才強制執行此檢查。 設置為0將禁用此檢查。 |
estimator | str or estimator instance (default=None) 如果通過,則在警告消息中包括估計器的名稱。 |
返回值 | 說明 |
---|---|
array_converted | object 轉換并驗證的數組。 |