sklearn.datasets.load_digits?
sklearn.datasets.load_digits(*, n_class=10, return_X_y=False, as_frame=False)
加載并返回數字數據集(分類)。
每個數據點都是一個8x8的數字圖像。
類 | 10 |
---|---|
每類的樣本數 | ~180 |
樣本總數 | 1797 |
維度 | 64 |
特征 | integers 0-16 |
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
n_class | integer, between 0 and 10, optional (default=10) 返回的類數。 |
return_X_y | bool, default=False. 如果為True,則返回(data, target)而不是Bunch對象。 有關data和target對象的更多信息,請參見下文。 版本0.18中的新功能。 |
as_frame | bool, default=False 如果為True,則數據為pandas DataFrame,其中包含具有適當dtypes(numeric)的列。 根據目標列的數量,目標是pandas DataFrame或Series。 如果return_X_y為True,則(data,target)將是pandas DataFrame或Series,如下所述。 0.23版中的新功能。 |
返回值 | 說明 |
---|---|
data | Bunch 類字典對象,具有以下屬性。 - data{ndarray, dataframe} of shape (1797, 64) 展平的數據矩陣。 如果as_frame = True,則數據將為pandas DataFrame。 - target: {ndarray, Series} of shape (1797,) 分類目標。 如果as_frame = True,target將是pandas系列。 - feature_names: list 數據集列的名稱。 - target_names: list 目標類的名稱。 0.20版中的新功能。 - frame: DataFrame of shape (1797, 65) 僅在as_frame = True時存在。 具有data和target的DataFrame。 0.23版中的新功能。 - images: {ndarray} of shape (1797, 8, 8) 原始圖像數據。 - DESCR: str 數據集的完整描述。 |
(data, target) | tuple if return_X_y is True版本0.18中的新功能。 |
這是UCI ML手寫數字數據集測試集的副本
https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
示例
加載數據并可視化圖像:
>>> from sklearn.datasets import load_digits
>>> digits = load_digits()
>>> print(digits.data.shape)
(1797, 64)
>>> import matplotlib.pyplot as plt
>>> plt.gray()
>>> plt.matshow(digits.images[0])
>>> plt.show()