sklearn.datasets.make_biclusters?
sklearn.datasets.make_biclusters(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)
生成具有恒定塊對角線結構的數組以進行雙聚類。
在用戶指南中閱讀更多內容。
參數 | 說明 |
---|---|
shape | iterable (n_rows, n_cols) 結果的形狀。 |
n_clusters | integer biclusters的數量。 |
noise | float, optional (default=0.0) 高斯噪聲的標準偏差。 |
minval | int, optional (default=10) bicluster的最小值。 |
maxval | int, optional (default=100) bicluster的最大值。 |
shuffle | boolean, optional (default=True) shuffle樣本。 |
random_state | int, RandomState instance, default=None 確定用于生成數據集的隨機數生成。為多個函數調用傳遞可重復輸出的int值。請參閱詞匯表。 |
返回值 | 說明 |
---|---|
X | array of shape shape 生成的數組。 |
rows | array of shape (n_clusters, X.shape[0],) 每行集群成員的指標。 |
cols | array of shape (n_clusters, X.shape[1],) 每個列的集群成員資格指標。 |
另見
參考
Dhillon, I. S. (2001, August). Co-clustering documents and words using bipartite spectral graph partitioning. In Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 269-274). ACM.