sklearn.feature_selection.f_regression?
sklearn.feature_selection.f_regression(X, y, *, center=True)
單變量線性回歸測試。
一種線性模型,用于測試多個回歸因子中每一個的單獨效果。這是用于特征選擇程序的評分函數,而不是獨立的特征選擇程序。
分兩個步驟完成:
計算每個回歸變量與目標之間的相關性,即(((X [:, i]-mean(X [:, i]))(y-mean_y))/(std(X [:, i] ) std(y))。 將其轉換為F分數,然后轉換為p值。
有關使用的更多信息,請參見用戶指南。
參數 | 說明 |
---|---|
X | {array-like, sparse matrix} shape = (n_samples, n_features) 將依次測試的一組回歸變量集合。 |
y | array of shape(n_samples). 數據矩陣。 |
center | True, bool, 如果為true,則X和y將居中。 |
返回值 | 說明 |
---|---|
F | array, shape=(n_features,) 特征的F值。 |
pval | array, shape=(n_features,) F得分的p值。 |
另見
共同目標的共同信息。
標簽與特征之間的ANOVA F值,用于分類任務。
分類任務的非負特征的卡方統計。
根據k個最高分數選擇特征。
根據誤報率測試選擇特征。
根據估計的錯誤發現率選擇特征。
根據多重比較錯誤率選擇特征。
根據最高分數的百分位數選擇特征。