sklearn.inspection.partial_dependence?

sklearn.inspection.partial_dependence(estimator, X, features, *, response_method='auto', percentiles=(0.050.95), grid_resolution=100, method='auto')

源碼

特征的部分依賴。

特征(或一組特征)的部分依賴關系對應于該特征的每個可能值的估算器的平均響應。

用戶指南中閱讀更多內容。

警告:

對于GradientBoostingClassifierGradientBoostingRegressor,‘recursion’方法(默認使用)將不考慮提升過程的初始預測變量。實際上,只要init是一個常數估算器(默認值),它將在目標響應中產生與‘brute’相同的值,直到一個恒定的偏移量。 但是,如果init不是常數估算器,則部分依賴關系值對于‘recursion’是不正確的,因為偏移量將取決于樣本。最好使用‘brute’方法。請注意,這僅適用于GradientBoostingClassifierGradientBoostingRegressor,不適用于HistGradientBoostingClassifierHistGradientBoostingRegressor

參數 說明
estimator BaseEstimator
一個適合的估計器對象,實現 predict,predict_proba 或 decision_function。不支持多輸出多類分類器。
X {array-like or dataframe} of shape (n_samples, n_features)
X用于生成目標features的值的網格(將在其中評估部分相關性),還用于在method為‘brute’時生成補數特征的值。
features array-like of {int, str}
應為其計算部分依賴的特征(例如[0])或一對相互作用的特征(例如[(0,1)])。
response_method ‘auto’, ‘predict_proba’ or ‘decision_function’, optional (default=’auto’)
指定是使用predict_proba還是decision_function作為目標響應。對于回歸量,將忽略此參數,并且響應始終是predict的輸出。默認情況下,將先嘗試使用predict_proba,如果不存在,則我們將恢復到decision_function。 如果method為‘recursion’(遞歸),則響應始終是decision_function的輸出。
percentiles tuple of float, optional (default=(0.05, 0.95))
上下百分比用于創建網格的極值。必須在[0,1]中。
grid_resolution int, optional (default=100)
每個目標特征在網格上等距的點數。
method str, optional (default=’auto’)
用于計算平均預測的方法:
- 僅某些基于樹的評估器支持‘recursion’(即 GradientBoostingClassifier, GradientBoostingRegressor, HistGradientBoostingClassifier, HistGradientBoostingRegressor, DecisionTreeRegressor, RandomForestRegressor,)但在速度方面效率更高。使用這種方法,分類器的目標響應始終是決策函數,而不是預測的概率。
- 任何估算器均支持‘brute’,但計算量更大。
- ‘auto’:‘recursion’用于支持它的估算器,否則使用‘brute’。
請參閱此注釋,以了解‘brute’和‘recursion’方法之間的區別。
返回值 說明
averaged_predictions ndarray,shape (n_outputs, len(values[0]), len(values[1]), …)
網格中所有點的預測值是X中所有樣本的平均值(如果方法為“遞歸”,則為訓練數據的平均值)。 n_outputs對應于多類設置中的類數,或對應于多輸出回歸的任務數。 對于經典回歸和二進制分類,n_outputs == 1n_values_feature_j對應于大小值[j]