sklearn.datasets.fetch_olivetti_faces?
sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False)
從AT&T(分類)中加載Olivetti人臉數據集。
如有必要,請下載。
類 | 40 |
---|---|
樣本總數 | 400 |
維度 | 4096 |
特征 | real, between 0 and 1 |
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
data_home | optional, default: None 為數據集指定另一個下載和緩存文件夾。 默認情況下,所有scikit-learn數據都存儲在“?/ scikit_learn_data”子文件夾中。 |
shuffle | boolean, optional 如果為True,則將shuffle數據集的順序,以避免對同一個人的圖像進行分組。 |
random_state | int, RandomState instance or None, default=0 確定用于數據集shuffle的隨機數生成。 為多個函數調用傳遞可重復輸出的int值。 請參閱詞匯表。 |
download_if_missing | optional, True by default 如果為False,則在數據不在本地可用時引發IOError,而不是嘗試從源站點下載數據。 |
return_X_y | boolean, default=False. 如果為True,則返回(數據,目標)而不是Bunch對象。 有關data和target對象的更多信息,請參見下文。 0.22版中的新功能。 |
返回值 | 說明 |
---|---|
data | Bunch 類字典對象,具有以下屬性。 - data:ndarray, shape (400, 4096) 每行對應于原始大小為64 x 64像素的散亂的面部圖像。 - images:ndarray, shape (400, 64, 64) 每行是對應于數據集的40個主題之一的面部圖像。 - target:ndarray, shape (400,) 與每個面部圖像關聯的標簽。 這些標簽的范圍是0-39,并且與“主題ID”相對應。 - DESCR:str 修改后的Olivetti Faces數據集的描述。 |
(data, target) | tuple if return_X_y=True 0.22版中的新功能。 |