sklearn.datasets.load_digits?

sklearn.datasets.load_digits(*, n_class=10, return_X_y=False, as_frame=False)

[源碼]

加載并返回數字數據集(分類)。

每個數據點都是一個8x8的數字圖像。

10
每類的樣本數 ~180
樣本總數 1797
維度 64
特征 integers 0-16

用戶指南中閱讀更多內容。

參數 說明
n_class integer, between 0 and 10, optional (default=10)
返回的類數。
return_X_y bool, default=False.
如果為True,則返回(data, target)而不是Bunch對象。 有關data和target對象的更多信息,請參見下文。
版本0.18中的新功能。
as_frame bool, default=False
如果為True,則數據為pandas DataFrame,其中包含具有適當dtypes(numeric)的列。 根據目標列的數量,目標是pandas DataFrame或Series。 如果return_X_y為True,則(data,target)將是pandas DataFrame或Series,如下所述。

0.23版中的新功能。
返回值 說明
data Bunch
類字典對象,具有以下屬性。
- data{ndarray, dataframe} of shape (1797, 64)
展平的數據矩陣。 如果as_frame = True,則數據將為pandas DataFrame。
- target: {ndarray, Series} of shape (1797,)
分類目標。 如果as_frame = True,target將是pandas系列。
- feature_names: list
數據集列的名稱。
- target_names: list
目標類的名稱。

0.20版中的新功能。
- frame: DataFrame of shape (1797, 65)
僅在as_frame = True時存在。 具有data和target的DataFrame。

0.23版中的新功能。
- images: {ndarray} of shape (1797, 8, 8)
原始圖像數據。
- DESCR: str
數據集的完整描述。
(data, target) tuple if return_X_y is True
版本0.18中的新功能。

這是UCI ML手寫數字數據集測試集的副本

https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits

示例

加載數據并可視化圖像:

>>> from sklearn.datasets import load_digits
>>> digits = load_digits()
>>> print(digits.data.shape)
(179764)
>>> import matplotlib.pyplot as plt 
>>> plt.gray() 
>>> plt.matshow(digits.images[0]) 
>>> plt.show()