手寫數據集分類練習?

關于在Digits數據集上使用分類技術的教程練習。

此練習在“有監督的學習”的“分類”部分中使用:從“用于科學數據處理的統計學習”教程的高維觀測部分預測輸出變量。

輸出:

KNN score: 0.961111
LogisticRegression score: 0.933333

輸入:

print(__doc__)

from sklearn import datasets, neighbors, linear_model

X_digits, y_digits = datasets.load_digits(return_X_y=True)
X_digits = X_digits / X_digits.max()

n_samples = len(X_digits)

X_train = X_digits[:int(.9 * n_samples)]
y_train = y_digits[:int(.9 * n_samples)]
X_test = X_digits[int(.9 * n_samples):]
y_test = y_digits[int(.9 * n_samples):]

knn = neighbors.KNeighborsClassifier()
logistic = linear_model.LogisticRegression(max_iter=1000)

print('KNN score: %f' % knn.fit(X_train, y_train).score(X_test, y_test))
print('LogisticRegression score: %f'
      % logistic.fit(X_train, y_train).score(X_test, y_test))

腳本的總運行時間:0分0.459秒。