sklearn.utils.check_array?

sklearn.utils.check_array(array, accept_sparse=False, *, accept_large_sparse=True, dtype='numeric', order=None, copy=False, force_all_finite=True, ensure_2d=True, allow_nd=False, ensure_min_samples=1, ensure_min_features=1, estimator=None)

源碼

對數組，列表，稀疏矩陣或類似內容進行輸入驗證。

默認情況下，輸入被檢查的值僅包含有限值的非空2D數組。如果數組的dtype是object，則嘗試轉換為float，失敗時引發錯誤。

參數	說明
array	object 輸入對象進行檢查/轉換。
accept_sparse	string, boolean or list of string (default=False) 表示允許稀疏矩陣格式的字符串，如csc, csr等。如果輸入是稀疏的，但不是允許的格式，它將被轉換為第一種列出的格式。True允許輸入任何格式。False表示如果是稀疏矩陣輸入會產生錯誤。
accept_large_sparse	bool (default=True) 如果提供了CSR，CSC，COO或BSR稀疏矩陣并被accept_sparse接受，則accept_large_sparse僅當其索引為32位dtype存儲時才會被接受。是0.20版中的新功能。
dtype	string, type, list of types or None (default=”numeric”) 返回結果的數據類型。如果為None，則保留輸入的dtype。如果為“ numeric”，則除非array.dtype是object，否則將保留dtype。如果dtype是類型列表，則僅當輸入的dtype不在列表中時，才對第一個類型進行轉換。
order	‘F’, ‘C’ or None (default=None) 設置數組將被強制為fortran還是c樣式
copy	boolean (default=False) 是否觸發強制復制。如果copy = False，則轉換可能會觸發復制。
force_all_finite	boolean or ‘allow-nan’, (default=True) 是否在X為np.inf，np.nan，pd.NA時引發錯誤。可能性為： True：強制X的所有值都是有限制的。 False：在X中接受np.inf，np.nan，pd.NA。 “ allow-nan”：僅接受X中的np.nan和pd.NA值。值不能為無限的。 0.20版中的新功能：force_all_finite接受字符串“ allow-nan”。在版本0.23中更改：接受pd.NA并將其轉換為np.nan
ensure_2d	boolean (default=True) 如果X不是2D，是否引發值錯誤。
allow_nd	boolean (default=False) 是否允許X.ndim> 2。
ensure_min_samples	int (default=1) 確保X在其第一個軸上具有最少數量的樣本（二維數組的行）。
ensure_min_features	int (default=1) 確保2D陣列具有最少數量的特征（列）。默認值1表示拒絕空數據集。僅當X有效具有2維或最初為1D并確保2d為True時，才強制執行此檢查。設置為0將禁用此檢查。
estimator	str or estimator instance (default=None) 如果通過，則在警告消息中包括估計器的名稱。

返回值	說明
array_converted	object 轉換并驗證的數組。