繪制單獨與投票回歸預測?
投票回歸器是一種集合元-估計器,適用于多個基回歸器,每個基估計器位于整個數據集上。然后對單個預測進行平均值,形成最終預測。我們將使用三個不同的回歸器來預測數據:GradientBoostingRegressor
, RandomForestRegressor
, 和 LinearRegression
)。然后,上述3個回歸器將用于 VotingRegressor
。
最后,我們將繪制所有模型的預測,以供比較。
我們將使用糖尿病數據集,該數據集由從一組糖尿病患者中收集的10個特征組成。該標簽是基線一年后疾病進展的定量指標。
print(__doc__)
import matplotlib.pyplot as plt
from sklearn.datasets import load_diabetes
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import VotingRegressor
11.3.1 訓練分類器
首先,我們將加載糖尿病數據集并啟動梯度提升回歸、隨機森林回歸器和線性回歸器。接下來,我們將使用三個回歸者來構建投票回歸器:
X, y = load_diabetes(return_X_y=True)
# Train classifiers
reg1 = GradientBoostingRegressor(random_state=1)
reg2 = RandomForestRegressor(random_state=1)
reg3 = LinearRegression()
reg1.fit(X, y)
reg2.fit(X, y)
reg3.fit(X, y)
ereg = VotingRegressor([('gb', reg1), ('rf', reg2), ('lr', reg3)])
ereg.fit(X, y)

11.3.2 作出預測
現在,我們將使用每個回歸器對前20個進行預測。
xt = X[:20]
pred1 = reg1.predict(xt)
pred2 = reg2.predict(xt)
pred3 = reg3.predict(xt)
pred4 = ereg.predict(xt)
11.3.3 繪制結果
最后,我們將可視化這20個預測。紅星顯示了VotingRegressor
所做的平均預測。
plt.figure()
plt.plot(pred1, 'gd', label='GradientBoostingRegressor')
plt.plot(pred2, 'b^', label='RandomForestRegressor')
plt.plot(pred3, 'ys', label='LinearRegression')
plt.plot(pred4, 'r*', ms=10, label='VotingRegressor')
plt.tick_params(axis='x', which='both', bottom=False, top=False,
labelbottom=False)
plt.ylabel('predicted')
plt.xlabel('training samples')
plt.legend(loc="best")
plt.title('Regressor predictions and their average')
plt.show()
腳本的總運行時間:(0分1.002秒)