datasets.fetch_species_distributions?

sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True)

[源碼]

Phillips等人的物種分布數據集加載程序。等（2006年）

在用戶指南中閱讀更多內容。

參數	說明
data_home	optional, default: None 為數據集指定另一個下載和緩存文件夾。默認情況下，所有scikit-learn數據都存儲在“?/ scikit_learn_data”子文件夾中。
download_if_missing	optional, True by default 如果為False，則在數據不在本地可用時引發IOError，而不是嘗試從源站點下載數據。

返回值說明

data Bunch
類字典對象，具有以下屬性。
- coverages:array, shape = [14, 1592, 1212]
這些代表在地圖網格的每個點測量的14個特征。下面討論了網格的緯度/經度值。缺少的數據由值-9999表示。
- trainrecord array, shape = (1624,)
數據的訓練點。每個點都有三個字段：

train ['species']是物種名稱

train ['dd long']是經度，以度為單位

train [‘dd lat’]是緯度，以度為單位
- testrecord array, shape = (620,)
數據的測試點。其格式與訓練數據相同。
- Nx, Ny:integers
網格中的經度（x）和緯度（y）數
- x_left_lower_corner, y_left_lower_cornerfloats
左下角的（x，y）位置，以度為單位
- grid_sizefloat
網格點之間的間距，以度為單位

返回值	說明
data	`Bunch` 類字典對象，具有以下屬性。 - coverages:array, shape = [14, 1592, 1212] 這些代表在地圖網格的每個點測量的14個特征。下面討論了網格的緯度/經度值。缺少的數據由值-9999表示。 - trainrecord array, shape = (1624,) 數據的訓練點。每個點都有三個字段： train ['species']是物種名稱 train ['dd long']是經度，以度為單位 train [‘dd lat’]是緯度，以度為單位 - testrecord array, shape = (620,) 數據的測試點。其格式與訓練數據相同。 - Nx, Ny:integers 網格中的經度（x）和緯度（y）數 - x_left_lower_corner, y_left_lower_cornerfloats 左下角的（x，y）位置，以度為單位 - grid_sizefloat 網格點之間的間距，以度為單位

注

該數據集表示物種的地理分布。該數據集是由Phillips等提供（2006）。

這兩個物種是：

“Bradypus variegatus” ，褐喉樹懶。
“Microryzomys minutus”，也被稱為森林小老鼠大米，嚙齒動物，生活在秘魯，哥倫比亞，厄瓜多爾，秘魯和委內瑞拉。
有關將此數據集與scikit-learn一起使用的示例，請參見examples/applications/plot_species_distribution_modeling.py。

參考資料

“Maximum entropy modeling of species geographic distributions” S. J. Phillips, R. P. Anderson, R. E. Schapire - Ecological Modelling, 190:231-259, 2006。

sklearn.datasets.fetch_species_distributions使用示例?

物種分布模型 ?

物種分布的核密度估計 ?