sklearn.datasets.fetch_lfw_people?
sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False)
將帶標簽的人臉加載到Wild(LFW)人群數據集中(分類)。
如有必要,請下載。
類 | 5749 |
---|---|
樣本總數 | 13233 |
維度 | 5828 |
特征 | real, between 0 and 255 |
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
data_home | optional, default: None 為數據集指定另一個下載和緩存文件夾。 默認情況下,所有scikit-learn數據都存儲在“?/ scikit_learn_data”子文件夾中。 |
funneled | oolean, optional, default: True 下載并使用數據集的漏斗形變體。 |
resize | float, optional, default 0.5 用于調整每張臉部圖片尺寸的比率。 |
min_faces_per_person | int, optional, default None 提取的數據集將僅保留具有至少min_faces_per_person個不同圖片的人的圖片。 |
color | boolean, optional, default False 保留3個RGB通道,而不是將它們平均為一個灰度通道。 如果color為True,則數據的形狀比color = False的形狀多一維。 |
slice_ | optional 提供自定義2D切片(高度,寬度)以提取jpeg文件的“interest”部分,并避免使用背景的統計相關性 |
download_if_missing | optional, True by default 如果為False,則在數據不在本地可用時引發IOError,而不是嘗試從源站點下載數據。 |
return_X_y | boolean, default=False. 如果為True,則返回(dataset.data,dataset.target)而不是Bunch對象。 請參閱下文,以獲取有關dataset.data和dataset.target對象的更多信息。 0.20版中的新功能。 |
返回值 | 說明 |
---|---|
dataset | Bunch 類字典對象,具有以下屬性。 - data:numpy array of shape (13233, 2914) 每行對應于原始大小為62 x 47像素的散亂的面部圖像。 更改slice_或resize參數將更改輸出的形狀。 - images:numpy array of shape (13233, 62, 47) 每行是對應于數據集中5749個人之一的面部圖像。 更改slice_或resize參數將更改輸出的形狀。 - target:numpy array of shape (13233,) 與每個面部圖像關聯的標簽。這些標簽的范圍是0-5748,并對應于人員ID。 - DESCR:string Wild(LFW)數據集中的帶標簽的人臉的描述。 |
(data, target) | tuple if return_X_y is True0.20版中的新功能。 |