手寫數據集分類練習?
關于在Digits數據集上使用分類技術的教程練習。
此練習在“有監督的學習”的“分類”部分中使用:從“用于科學數據處理的統計學習”教程的高維觀測部分預測輸出變量。
輸出:
KNN score: 0.961111
LogisticRegression score: 0.933333
輸入:
print(__doc__)
from sklearn import datasets, neighbors, linear_model
X_digits, y_digits = datasets.load_digits(return_X_y=True)
X_digits = X_digits / X_digits.max()
n_samples = len(X_digits)
X_train = X_digits[:int(.9 * n_samples)]
y_train = y_digits[:int(.9 * n_samples)]
X_test = X_digits[int(.9 * n_samples):]
y_test = y_digits[int(.9 * n_samples):]
knn = neighbors.KNeighborsClassifier()
logistic = linear_model.LogisticRegression(max_iter=1000)
print('KNN score: %f' % knn.fit(X_train, y_train).score(X_test, y_test))
print('LogisticRegression score: %f'
% logistic.fit(X_train, y_train).score(X_test, y_test))
腳本的總運行時間:0分0.459秒。