6.5 無監督降維?
如果數據集的特征數量很多,則在進行有監督的步驟之前先通過無監督的步驟來減少特征數可能會很有用。許多 無監督學習方法都實現了一種可用于降低維度的transform
方法。下面,我們討論大量使用此模式的兩個特定示例。
Pipelining
無監督的數據約簡和有監督的估計器只需一步即可鏈接在一起。請參閱Pipelining:鏈接估算器。
6.5.1 PCA:主成分分析
decomposition.PCA
尋找可以捕捉原始特征方差的特征組合。請參閱分解組件中的信號(矩陣分解問題)。
示例
6.5.2 隨機投影
模塊:random_projection
提供了幾種用于通過隨機投影進行數據縮減的工具。請參閱文檔的相關部分:隨機投影。
例子
6.5.3 特征聚集
cluster.FeatureAgglomeration
應用 層次聚類將行為相似的特征分組在一起。
例子
功能縮放
請注意,如果特征具有不同的縮放比例或統計屬性,則
cluster.FeatureAgglomeration
可能無法捕獲相關特征之間的關系。在這些設置中使用preprocessing.StandardScaler
可能會有用。