sklearn.datasets.fetch_olivetti_faces?

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False)

[源碼]

從AT&T(分類)中加載Olivetti人臉數據集。

如有必要,請下載。

40
樣本總數 400
維度 4096
特征 real, between 0 and 1

用戶指南中閱讀更多內容。

參數 說明
data_home optional, default: None
為數據集指定另一個下載和緩存文件夾。 默認情況下,所有scikit-learn數據都存儲在“?/ scikit_learn_data”子文件夾中。
shuffle boolean, optional
如果為True,則將shuffle數據集的順序,以避免對同一個人的圖像進行分組。
random_state int, RandomState instance or None, default=0
確定用于數據集shuffle的隨機數生成。 為多個函數調用傳遞可重復輸出的int值。 請參閱詞匯表
download_if_missing optional, True by default
如果為False,則在數據不在本地可用時引發IOError,而不是嘗試從源站點下載數據。
return_X_y boolean, default=False.
如果為True,則返回(數據,目標)而不是Bunch對象。 有關data和target對象的更多信息,請參見下文。

0.22版中的新功能。
返回值 說明
data Bunch
類字典對象,具有以下屬性。
- data:ndarray, shape (400, 4096)
每行對應于原始大小為64 x 64像素的散亂的面部圖像。
- images:ndarray, shape (400, 64, 64)
每行是對應于數據集的40個主題之一的面部圖像。
- target:ndarray, shape (400,)
與每個面部圖像關聯的標簽。 這些標簽的范圍是0-39,并且與“主題ID”相對應。
- DESCR:str
修改后的Olivetti Faces數據集的描述。
(data, target) tuple if return_X_y=True
0.22版中的新功能。