1.8 交叉分解?
交叉分解模塊包含兩大類算法:偏最小二乘法(PLS)和典型相關分析(CCA)。
這幾類算法對于尋找兩個多元數據集之間的線性關系是很有用的:fit
方法的X
和Y
參數是二維數組。
交叉分解算法能夠找到兩個矩陣 (X 和 Y) 的基礎關系。它們是對在兩個空間的協方差結構進行建模的隱變量方法。它們將嘗試在X空間中找到多維方向,該方向能夠解釋Y空間中最大多維方差方向。 PLS回歸特別適用于當預測變量矩陣具有比觀測值更多的變量以及當X值存在多重共線性的情況。相比之下,在這些情況下,標準回歸將失敗。
本模塊中包含的類有PLSRegression
PLSCanonical
, CCA
和 PLSSVD
。
參考
JA Wegelin A survey of Partial Least Squares (PLS) methods, with emphasis on the two-block case
示例 |
---|
交叉分解法比較 |