sklearn.linear_model.ridge_regression?

sklearn.linear_model.ridge_regression(X,y,alpha,*,sample_weight = None,Solver ='auto',max_iter = None,tol = 0.001,verbose = 0,random_state = None,return_n_iter = False,return_intercept = False,check_input = True )

[源碼]

用正規方程法求解嶺方程。

用戶指南中閱讀更多內容。

參數 說明
X {ndarray, sparse matrix, LinearOperator} of shape (n_samples, n_features)
用于訓練的數據
y ndarray of shape (n_samples,) or (n_samples, n_targets)
目標值
alpha float or array-like of shape (n_targets,)
正則強度;必須為正浮點數。正則化改善了問題的狀況,并減少了估計的方差。值越大表示正則化更強。在其他線性模型中,Alpha對應于1 / (2C),例如LogisticRegressionsklearn.svm.LinearSVC。如果傳遞數組,則認為懲罰是特定于目標的。因此,它們必須在數量上對應。
sample_weight float or array-like of shape (n_samples,), default=None
每個樣本的獨立權重。如果給定一個浮點值,則每個樣本的權量都相同。如果sample_weight不為None且solver ='auto',則solver將被設置為'cholesky'。

0.17版中的新功能。
solver {‘auto’, ‘svd’, ‘cholesky’, ‘lsqr’, ‘sparse_cg’, ‘sag’, ‘saga’}, default=’auto’
用于計算例程的求解器:

- ‘auto’根據數據類型自動選擇求解器。
- ‘svd’使用X的奇異值分解來計算Ridge系數。奇異矩陣比“ Cholesky”更穩定。
- 'cholesky'使用標準的scipy.linalg.solve函數通過點(XT,X)的Cholesky分解獲得封閉的解
- 'sparse_cg'使用scipy.sparse.linalg.cg中的共軛梯度求解器。作為一種迭代算法,此求解器比' cholesky '更適合用于大規模數據(設置tolmax_iter的可能性)。
- ‘lsqr’使用專用的正則化最小二乘例程scipy.sparse.linalg.lsqr。它是最快的,并且使用了迭代過程。
- ‘sag’使用隨機平均梯度下降,“ saga”使用其改進的無偏版本SAGA。兩種方法都使用迭代過程,并且當n_samples和n_features都很大時,通常比其他求解器更快。注意,只有在比例大致相同的特征上才能保證“ sag”和“ saga”快速收斂。您可以使用sklearn.preprocessing中的縮放器對數據進行預處理。

最后五個求解器均支持密集和稀疏數據。但是,當fit_intercept為True 時,僅'sag'和'sparse_cg'支持稀疏輸入。

*版本0.17中的新功能:*隨機平均梯度下降求解器。

0.19版中的新功能: SAGA求解器。
max_iter int, default=None
共軛梯度求解器的最大迭代次數。對于“ sparse_cg”和“ lsqr”求解器,默認值由scipy.sparse.linalg決定。對于“ sag”和“ saga”求解器,默認值為1000。
tol float, default=1e-3
解決方案的準確率。
verbose int, default=0
詳細程度。設置verbose> 0將顯示其他信息,具體取決于所使用的求解器。
random_state int, RandomState instance, default=None
solver=='sag'或'saga'打亂數據時使用。有關詳細信息,請參見詞匯表
return_n_iter bool, default=False
如果為True,則該方法還返回n_iter,由求解器執行的實際迭代次數。

0.17版中的新功能。
return_intercept bool, default=False
如果為True且X是稀疏的,則該方法還會返回截距,并且求解器會自動更改為'sag'。這只是用于將截距與稀疏數據擬合的臨時解決方案。對于密集數據,請在回歸之前使用sklearn.linear_model._preprocess_data。

0.17版中的新功能。
check_input bool, default=True
如果為False,將不檢查輸入數組X和y。

0.21版中的新功能。
返回值 說明
coef ndarray of shape (n_features,) or (n_targets, n_features)
權重向量。
n_iter int, optional
求解器執行的實際迭代次數。僅在return_n_iter為True時返回。
intercept float or ndarray of shape (n_targets,)
模型的截距。僅當return_intercept 為True且X為稀疏數組時返回。

這個函數不會計算截距。