sklearn.datasets.fetch_covtype?

sklearn.datasets.fetch_covtype(*, data_home=None, download_if_missing=True, random_state=None, shuffle=False, return_X_y=False)

[源碼]

加載covertype數據集(分類)。

如有必要,請下載。

7
樣本總數 581012
Dimensionality 54
特征 int

用戶指南中閱讀更多內容。

參數 說明
data_home string, optional
為數據集指定另一個下載和緩存文件夾。 默認情況下,所有scikit-learn數據都存儲在“?/ scikit_learn_data”子文件夾中。
download_if_missing boolean, default=True
如果為False,則在數據不在本地可用時引發IOError,而不是嘗試從源站點下載數據。
random_state int, RandomState instance, default=None
確定用于數據集改組的隨機數生成。 為多個函數調用傳遞可重復輸出的int值。 請參閱詞匯表
shuffle bool, default=False
是否shuffle數據集。
return_X_y boolean, default=False
如果為True,則返回(data.data,data.target)而不是Bunch對象。

0.20版中的新功能。
返回值 說明
dataset Bunch
類字典對象,具有以下屬性。
- data: numpy array of shape (581012, 54)
每行對應于數據集中的54個要素。
- target: numpy array of shape (581012,)
每個值對應于7種forest covertypes之一,其值在1到7之間。
- DESCR: str
forest covertype數據集的描述。
(data, target) tuple if return_X_y is True
0.20版中的新功能。