sklearn.inspection.partial_dependence?

sklearn.inspection.partial_dependence(estimator, X, features, *, response_method='auto', percentiles=(0.05, 0.95), grid_resolution=100, method='auto')

源碼

特征的部分依賴。

特征（或一組特征）的部分依賴關系對應于該特征的每個可能值的估算器的平均響應。

在用戶指南中閱讀更多內容。

警告：

對于GradientBoostingClassifier和GradientBoostingRegressor，‘recursion’方法（默認使用）將不考慮提升過程的初始預測變量。實際上，只要init是一個常數估算器（默認值），它將在目標響應中產生與‘brute’相同的值，直到一個恒定的偏移量。但是，如果init不是常數估算器，則部分依賴關系值對于‘recursion’是不正確的，因為偏移量將取決于樣本。最好使用‘brute’方法。請注意，這僅適用于GradientBoostingClassifier和GradientBoostingRegressor，不適用于HistGradientBoostingClassifier和HistGradientBoostingRegressor。

參數	說明
estimator	BaseEstimator 一個適合的估計器對象，實現 predict，predict_proba 或 decision_function。不支持多輸出多類分類器。
X	{array-like or dataframe} of shape (n_samples, n_features) X用于生成目標`features`的值的網格（將在其中評估部分相關性），還用于在`method`為‘brute’時生成補數特征的值。
features	array-like of {int, str} 應為其計算部分依賴的特征（例如[`0`]）或一對相互作用的特征（例如[`（0，1）`]）。
response_method	‘auto’, ‘predict_proba’ or ‘decision_function’, optional (default=’auto’) 指定是使用predict_proba還是decision_function作為目標響應。對于回歸量，將忽略此參數，并且響應始終是predict的輸出。默認情況下，將先嘗試使用predict_proba，如果不存在，則我們將恢復到decision_function。如果`method`為‘recursion’(遞歸)，則響應始終是decision_function的輸出。
percentiles	tuple of float, optional (default=(0.05, 0.95)) 上下百分比用于創建網格的極值。必須在[0，1]中。
grid_resolution	int, optional (default=100) 每個目標特征在網格上等距的點數。
method	str, optional (default=’auto’) 用于計算平均預測的方法： - 僅某些基于樹的評估器支持‘recursion’（即 GradientBoostingClassifier, GradientBoostingRegressor, HistGradientBoostingClassifier, HistGradientBoostingRegressor, DecisionTreeRegressor, RandomForestRegressor,）但在速度方面效率更高。使用這種方法，分類器的目標響應始終是決策函數，而不是預測的概率。 - 任何估算器均支持‘brute’，但計算量更大。 - ‘auto’：‘recursion’用于支持它的估算器，否則使用‘brute’。請參閱此注釋，以了解‘brute’和‘recursion’方法之間的區別。

返回值	說明
averaged_predictions	ndarray,shape (n_outputs, len(values[0]), len(values[1]), …) 網格中所有點的預測值是X中所有樣本的平均值（如果方法為“遞歸”，則為訓練數據的平均值）。 `n_outputs`對應于多類設置中的類數，或對應于多輸出回歸的任務數。對于經典回歸和二進制分類，`n_outputs == 1`。`n_values_feature_j`對應于大小值`[j]`。