sklearn.feature_selection.f_regression?

sklearn.feature_selection.f_regression(X, y, *, center=True)

[源碼]

單變量線性回歸測試。

一種線性模型,用于測試多個回歸因子中每一個的單獨效果。這是用于特征選擇程序的評分函數,而不是獨立的特征選擇程序。

分兩個步驟完成:

  1. 計算每個回歸變量與目標之間的相關性,即(((X [:, i]-mean(X [:, i]))(y-mean_y))/(std(X [:, i] ) std(y))。
  2. 將其轉換為F分數,然后轉換為p值。

有關使用的更多信息,請參見用戶指南

參數 說明
X {array-like, sparse matrix} shape = (n_samples, n_features)
將依次測試的一組回歸變量集合。
y array of shape(n_samples).
數據矩陣。
center True, bool,
如果為true,則X和y將居中。
返回值 說明
F array, shape=(n_features,)
特征的F值。
pval array, shape=(n_features,)
F得分的p值。

另見

  • mutual_info_regression

    共同目標的共同信息。

  • f_classif

    標簽與特征之間的ANOVA F值,用于分類任務。

  • chi2

    分類任務的非負特征的卡方統計。

  • SelectKBest

    根據k個最高分數選擇特征。

  • SelectFpr

    根據誤報率測試選擇特征。

  • SelectFdr

    根據估計的錯誤發現率選擇特征。

  • SelectFwe

    根據多重比較錯誤率選擇特征。

  • SelectPercentile

    根據最高分數的百分位數選擇特征。

sklearn.feature_selection.f_regression使用示例?