sklearn.datasets.make_gaussian_quantiles?

sklearn.datasets.make_gaussian_quantiles(*, mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3, shuffle=True, random_state=None)

[源碼]

通過分位數生成各向同性的高斯并標記樣本

通過采用多維標準正態分布并定義由嵌套的同心多維球體分隔的類,以使每個類中的樣本數量大致相等(分配)。

在用戶指南中閱讀更多內容。

參數 說明
mean array of shape [n_features], optional (default=None)
多維正態分布的均值。如果為None,則使用原點(0,0,…)。
cov float, optional (default=1.)
協方差矩陣將是該值乘以單位矩陣。該數據集僅產生對稱正態分布。
n_samples int, optional (default=100)
總點數在各類之間平均分配。
n_features int, optional (default=2)
每個樣本的特征數量。
n_classes int, optional (default=3)
類的數量。
shuffle boolean, optional (default=True)
shuffle樣本。
random_state int, RandomState instance, default=None
確定用于生成數據集的隨機數生成。 為多個函數調用傳遞可重復輸出的int值。 請參閱詞匯表
返回值 說明
X array of shape [n_samples, n_features]
生成的樣本。
y array of shape [n_samples]
每個樣本的分位數隸屬關系的整數標簽。

數據集來自Zhu等人[1]。

參考

  • 1

    Zhu, H. Zou, S. Rosset, T. Hastie, “Multi-class AdaBoost”, 2009.

sklearn.datasets.make_gaussian_quantiles使用示例?