sklearn.inspection.partial_dependence?
sklearn.inspection.partial_dependence(estimator, X, features, *, response_method='auto', percentiles=(0.05, 0.95), grid_resolution=100, method='auto')
特征的部分依賴。
特征(或一組特征)的部分依賴關系對應于該特征的每個可能值的估算器的平均響應。
在用戶指南中閱讀更多內容。
警告:
對于GradientBoostingClassifier
和GradientBoostingRegressor
,‘recursion’方法(默認使用)將不考慮提升過程的初始預測變量。實際上,只要init是一個常數估算器(默認值),它將在目標響應中產生與‘brute’相同的值,直到一個恒定的偏移量。 但是,如果init不是常數估算器,則部分依賴關系值對于‘recursion’是不正確的,因為偏移量將取決于樣本。最好使用‘brute’方法。請注意,這僅適用于GradientBoostingClassifier
和GradientBoostingRegressor
,不適用于HistGradientBoostingClassifier
和HistGradientBoostingRegressor
。
參數 | 說明 |
---|---|
estimator | BaseEstimator 一個適合的估計器對象,實現 predict,predict_proba 或 decision_function。不支持多輸出多類分類器。 |
X | {array-like or dataframe} of shape (n_samples, n_features) X用于生成目標 features 的值的網格(將在其中評估部分相關性),還用于在method 為‘brute’時生成補數特征的值。 |
features | array-like of {int, str} 應為其計算部分依賴的特征(例如[ 0 ])或一對相互作用的特征(例如[(0,1) ])。 |
response_method | ‘auto’, ‘predict_proba’ or ‘decision_function’, optional (default=’auto’) 指定是使用predict_proba還是decision_function作為目標響應。對于回歸量,將忽略此參數,并且響應始終是predict的輸出。默認情況下,將先嘗試使用predict_proba,如果不存在,則我們將恢復到decision_function。 如果 method 為‘recursion’(遞歸),則響應始終是decision_function的輸出。 |
percentiles | tuple of float, optional (default=(0.05, 0.95)) 上下百分比用于創建網格的極值。必須在[0,1]中。 |
grid_resolution | int, optional (default=100) 每個目標特征在網格上等距的點數。 |
method | str, optional (default=’auto’) 用于計算平均預測的方法: - 僅某些基于樹的評估器支持‘recursion’(即 GradientBoostingClassifier, GradientBoostingRegressor, HistGradientBoostingClassifier, HistGradientBoostingRegressor, DecisionTreeRegressor, RandomForestRegressor,)但在速度方面效率更高。使用這種方法,分類器的目標響應始終是決策函數,而不是預測的概率。 - 任何估算器均支持‘brute’,但計算量更大。 - ‘auto’:‘recursion’用于支持它的估算器,否則使用‘brute’。 請參閱此注釋,以了解‘brute’和‘recursion’方法之間的區別。 |
返回值 | 說明 |
---|---|
averaged_predictions | ndarray,shape (n_outputs, len(values[0]), len(values[1]), …) 網格中所有點的預測值是X中所有樣本的平均值(如果方法為“遞歸”,則為訓練數據的平均值)。 n_outputs 對應于多類設置中的類數,或對應于多輸出回歸的任務數。 對于經典回歸和二進制分類,n_outputs == 1 。n_values_feature_j 對應于大小值[j] 。 |