sklearn.datasets.fetch_lfw_people?

sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70195None), slice(78172None)), download_if_missing=True, return_X_y=False)

[源碼]

將帶標簽的人臉加載到Wild(LFW)人群數據集中(分類)。

如有必要,請下載。

5749
樣本總數 13233
維度 5828
特征 real, between 0 and 255

用戶指南中閱讀更多內容。

參數 說明
data_home optional, default: None
為數據集指定另一個下載和緩存文件夾。 默認情況下,所有scikit-learn數據都存儲在“?/ scikit_learn_data”子文件夾中。
funneled oolean, optional, default: True
下載并使用數據集的漏斗形變體。
resize float, optional, default 0.5
用于調整每張臉部圖片尺寸的比率。
min_faces_per_person int, optional, default None
提取的數據集將僅保留具有至少min_faces_per_person個不同圖片的人的圖片。
color boolean, optional, default False
保留3個RGB通道,而不是將它們平均為一個灰度通道。 如果color為True,則數據的形狀比color = False的形狀多一維。
slice_ optional
提供自定義2D切片(高度,寬度)以提取jpeg文件的“interest”部分,并避免使用背景的統計相關性
download_if_missing optional, True by default
如果為False,則在數據不在本地可用時引發IOError,而不是嘗試從源站點下載數據。
return_X_y boolean, default=False.
如果為True,則返回(dataset.data,dataset.target)而不是Bunch對象。 請參閱下文,以獲取有關dataset.data和dataset.target對象的更多信息。

0.20版中的新功能。
返回值 說明
dataset Bunch
類字典對象,具有以下屬性。
- data:numpy array of shape (13233, 2914)
每行對應于原始大小為62 x 47像素的散亂的面部圖像。 更改slice_或resize參數將更改輸出的形狀。
- images:numpy array of shape (13233, 62, 47)
每行是對應于數據集中5749個人之一的面部圖像。 更改slice_或resize參數將更改輸出的形狀。
- target:numpy array of shape (13233,)
與每個面部圖像關聯的標簽。這些標簽的范圍是0-5748,并對應于人員ID。
- DESCR:string
Wild(LFW)數據集中的帶標簽的人臉的描述。
(data, target) tuple if return_X_y is True
0.20版中的新功能。

sklearn.datasets.fetch_lfw_people使用示例?